Perceptron

Perceptron
Einfaches dreilagiges feed-forward Perzeptron mit fünf Input-, drei Hidden- und einem Output-Neuron, sowie zwei Bias-Neuronen

Das Perzeptron (engl. perceptron, nach engl. perception, „Wahrnehmung“) ist ein vereinfachtes künstliches neuronales Netz, das zuerst von Frank Rosenblatt 1958 vorgestellt wurde. Es besteht in der Grundversion (einfaches Perzeptron) aus einem einzelnen künstlichen Neuron mit anpassbaren Gewichtungen und einem Schwellenwert. Unter diesem Begriff werden heute verschiedene Kombinationen des ursprünglichen Modells verstanden, dabei wird zwischen einlagigen und mehrlagigen Perzeptrons (engl. multi-layer perceptron, MLP) unterschieden. Die prinzipielle Arbeitsweise besteht darin, einen Eingabevektor in einen Ausgabevektor umzuwandeln und damit stellt es einen einfachen Assoziativspeicher dar.

Inhaltsverzeichnis

Geschichte

1943 führten die Mathematiker Warren McCulloch und Walter Pitts das "Neuron" als logisches Schwellwert-Element mit mehreren Eingängen und einem einzigen Ausgang in die Informatik ein (WS McCulloch, W Pitts: A logical calculus of the ideas immanent in nervous activity. Bull Math. Biophys., 5, 115-133, 1943). Es konnte als Bool'sche Variable die Zustände true und false annehmen und "feuerte" (= true), wenn die Summe der Eingangssignale einen Schwellenwert überschritt. Dies entsprach der neurobiologischen Analogie eines Aktionspotenzials, das eine Nervenzelle bei einer kritischen Änderung ihres Membranpotenzials aussendet. McCulloch und Pitts zeigten, dass durch geeignete Kombination mehrerer solcher Neuronen jede einfache aussagenlogische Funktion (UND, ODER, NICHT) beschreibbar ist.

1949 stellte der Psychologe Donald O. Hebb die Hypothese auf, Lernen beruhe darauf, dass sich die aktivierende oder hemmende Wirkung einer Synapse als Produkt der prä- und postsynaptischen Aktivität berechnen lasse (D Hebb: Organization of Behaviour. Wiley, New York, 1949). Es gibt gute Anhaltspunkte dass die Langzeit-Potenzierung und STDP die biologischen Korrelate des Hebbschen Postulates sind. Ein endgültiger Beweis für die Allgemeingültigkeit auch beim Menschen steht aber noch aus.

1958 schließlich publizierte Frank Rosenblatt das Perzeptron-Modell, das bis heute die Grundlage künstlicher neuronaler Netze darstellt (F Rosenblatt: The perceptron - a probablistic model for information storage and organization in the brain. Psychological Review 65, 1958).

Einlagiges Perzeptron

Beim einlagigen Perzeptron gibt es nur eine einzige Schicht aus künstlichen Neuronen, welche zugleich den Ausgabevektor repräsentiert. Jedes Neuron wird dabei durch eine Neuronenfunktion repräsentiert und erhält den gesamten Eingabevektor als Parameter. Die Verarbeitung erfolgt ganz ähnlich zur sogenannten Hebbschen Lernregel für natürliche Neuronen. Allerdings wird der Aktivierungsfaktor dieser Regel durch eine Differenz zwischen Soll- und Istwert ersetzt. Da die Hebbsche Lernregel sich auf die Gewichtung der einzelnen Eingangswerte bezieht, erfolgt also das Lernen eines Perzeptrons durch die Anpassung der Gewichtung eines jeden Neurons. Sind die Gewichtungen einmal gelernt, so ist ein Perzeptron auch in der Lage, Eingabevektoren zu klassifizieren, die vom ursprünglich gelernten Vektor leicht abweichen. Gerade darin besteht die gewünschte Klassifizierungsfähigkeit des Perzeptrons, der es seinen Namen verdankt.

Perzeptron-Lernregel

Es gibt verschiedene Versionen der Lernregel, um auf die unterschiedlichen Definitionen des Perzeptrons einzugehen. Für ein Perzeptron mit binären Ein- und Ausgabewerten wird hier die Lernregel angegeben.

Folgende Überlegungen liegen der Lernregel des Perzeptrons zu Grunde:

  1. Wenn die Ausgabe eines Neurons 1 (bzw. 0) ist und den Wert 1 (bzw. 0) annehmen soll, dann werden die Gewichtungen nicht geändert.
  2. Ist die Ausgabe 0, soll aber den Wert 1 annehmen, dann werden die Gewichte inkrementiert
  3. Ist die Ausgabe 1, soll aber den Wert 0 annehmen, dann werden die Gewichte dekrementiert

Mathematisch wird der Sachverhalt folgendermaßen ausgedrückt:

w_{ij}^{\mathrm{neu}}=w_{ij}^{\mathrm{alt}} + \Delta w_{ij},
\Delta w_{ij} = \alpha \cdot (t_{j} - o_{j}) \cdot x_{i}.

Dabei ist

Δwij die Änderung des Gewichts wij für die Verbindung zwischen der Eingabezelle i und Ausgabezelle j,
tj die gewünschte Ausgabe des Neurons j,
oj die tatsächliche Ausgabe,
xi die Eingabe des Neurons i und
α > 0 der Lerngeschwindigkeits-Koeffizient.

Eine Gewichtsaktualisierung im Schritt k verläuft danach wie folgt:

  1. wij(k + 1) = wij(k) bei korrekter Ausgabe,
  2. wij(k + 1) = wij(k) + αxi bei Ausgabe 0 und gewünschter Ausgabe 1 und
  3. wij(k + 1) = wij(k) − αxi bei Ausgabe 1 und gewünschter Ausgabe 0.

Rosenblatt konnte im Konvergenztheorem nachweisen, dass mit dem angegebenen Lernverfahren alle Lösungen eingelernt werden können, die ein Perzeptron repräsentieren kann.

XOR-Problem

Frank Rosenblatt zeigte, dass ein einfaches Perzeptron mit zwei Eingabewerten und einem einzigen Ausgabeneuron zur Darstellung der einfachen logischen Operatoren AND, OR und NOT genutzt werden kann. Marvin Minsky und Seymour Papert wiesen jedoch 1969 nach, dass ein einlagiges Perzeptron den XOR-Operator nicht auflösen kann (Problem der linearen Separierbarkeit). Dies führte zu einem Stillstand in der Forschung der künstlichen neuronalen Netze (KNN).

Die in diesem Zusammenhang zum Teil äußerst polemisch geführte Diskussion war letztlich ein Richtungsstreit zwischen den Vertretern der "Künstlichen Intelligenz" und der "Konnektionisten" um Forschungsgelder. Frank Rosenblatt hatte zwar gezeigt, dass zusammengesetzte logische Operatoren wie XOR (= OR but NOT AND) durch Verwendung eines mehrlagigen Perzeptrons beschrieben werden können, er starb jedoch zu früh, um sich gegen die Angriffe seiner KI-Kollegen zu wehren.

Das Perzeptron als linearer Klassifikator

Jenseits aller (pseudo-)biologischen Analogien ist ein einlagiges Perzeptron letztlich nichts weiter als ein linearer Klassifikator der Form x = a1y1 + a2y2 + ... + anyn (lineare Diskriminanzfunktion, multiple Regression). In der Nomenklatur der künstlichen neuronalen Netze werden a1 bis an als Gewichte und y1 bis yn als Eingangssignale bezeichnet, wobei letztere nur Werte von 0 oder 1 (true oder false) annehmen können. Überschreitet die Summe x einen Schwellenwert, so wird die Zuordnung der gesuchten Klasse auf true bzw. 1 gesetzt, sonst auf false bzw. 0.

Mehrlagiges Perzeptron

Zweilagiges Perzeptron zur Berechnung der XOR-Funktion

Die Beschränkung des einlagigen Perzeptrons konnte später mit dem mehrlagigen Perzeptron gelöst werden, bei dem es neben der Ausgabeschicht auch noch mindestens eine weitere Schicht verdeckter Neuronen gibt (engl. hidden layer). Alle Neuronen einer Schicht sind vollständig mit den Neuronen der nächsten Schicht vorwärts verknüpft (Feedforward-Netze). Weitere Topologien haben sich ebenfalls bewährt:

  • Full-Connection: Die Neuronen einer Schicht werden mit den Neuronen aller folgenden Schichten verbunden.
  • Short-Cuts: Einige Neuronen sind nicht nur mit allen Neuronen der nächsten Schicht verbunden, sondern darüber hinaus mit weiteren Neuronen der übernächsten Schichten.

Ein mehrlagiges Perzeptron kann unter anderem mit dem Backpropagation-Algorithmus trainiert werden. Hierbei werden die Gewichte der Verbindungen so verändert, dass das Netz die gewünschten Muster nach einer kontrollierten Trainingsphase (engl. supervised learning) klassifizieren kann.

Siehe auch

Literatur

  • Rosenblatt, Frank (1958): The perceptron : a probabilistic model for information storage and organization in the brain. Psychological Reviews 65 (1958) 386-408
  • M. L. Minsky und S. A. Papert, Perceptrons. 2nd Edition, MIT-Press 1988, ISBN 0-262-63111-3

Weblinks


Wikimedia Foundation.

Игры ⚽ Нужно сделать НИР?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • Perceptrón — Saltar a navegación, búsqueda Perceptrón con 2 entradas El Perceptrón es un tipo de red neuronal artificial desarrollado por Frank Rosenblatt, véase Perceptrón multicapa, también puede entenderse como perceptrón la neurona artificial y unidad… …   Wikipedia Español

  • Perceptron — Perceptrons redirects here. For the book of that title, see Perceptrons (book). The perceptron is a type of artificial neural network invented in 1957 at the Cornell Aeronautical Laboratory by Frank Rosenblatt.[1] It can be seen as the simplest… …   Wikipedia

  • Perceptron — Le perceptron a été inventé en 1957 par Frank Rosenblatt au Cornell Aeronautical Laboratory, inspiré par la théorie cognitive de Friedrich Hayek et celle de Donald Hebb. Sommaire 1 Définition 2 La règle de Hebb 3 La règle d apprentissage du Perc …   Wikipédia en Français

  • Perceptrón — ► sustantivo masculino TECNOLOGÍA Sistema autoadaptativo que consiste en un circuito que realiza percepciones análogas a las del cerebro animal. * * * Un perceptrón se refiere a una neurona artificial y también como a la unidad básica de… …   Enciclopedia Universal

  • Perceptron multicouche — Le Perceptron multicouche est un Classifieur linéaire de type réseau neuronal formel organisé en plusieurs couches au sein desquelles une information circule de la couche d entrée vers la couche de sortie uniquement ; il s agit donc d un… …   Wikipédia en Français

  • Perceptrón multicapa — Saltar a navegación, búsqueda El perceptrón multicapa es una red neuronal artificial (RNA) formada por múltiples capas, esto le permite resolver problemas que no son linealmente separables, lo cual es la principal limitación del perceptrón… …   Wikipedia Español

  • Perceptron-Konvergenz-Theorem — Einfaches dreilagiges feed forward Perzeptron mit fünf Input , drei Hidden und einem Output Neuron, sowie zwei Bias Neuronen Das Perzeptron (engl. perceptron, nach engl. perception, „Wahrnehmung“) ist ein vereinfachtes künstliches neuronales Netz …   Deutsch Wikipedia

  • Perceptrón multicapa — En el estudio de la inteligencia artificial, se conoce un perceptrón multicapa como aquella red neuronal artificial (RNA) cuyas neuronas se encuentran distribuidas en capas, de modo que las salidas de todas las neuronas que constituyen una… …   Enciclopedia Universal

  • perceptron — noun a) an element, analogous to a neuron, of an artificial neural network consisting of one or more layers of artificial neurons b) a network of such elements. Syn: McCulloch Pitts neuron …   Wiktionary

  • perceptron — m IV, D. u, Ms. perceptronnie; lm M. y techn. «elektroniczne urządzenie rozpoznające; receptor z przetwarzaniem informacji» ‹skrót.› …   Słownik języka polskiego

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”