Soziale Simulationen - PowerPoint PPT Presentation

1 / 64
About This Presentation
Title:

Soziale Simulationen

Description:

Title: Soziale Simulationen Author: Matthias Schmitt Last modified by: Matthias Schmitt Created Date: 8/4/2004 3:05:23 PM Document presentation format – PowerPoint PPT presentation

Number of Views:133
Avg rating:3.0/5.0
Slides: 65
Provided by: Matthias50
Category:

less

Transcript and Presenter's Notes

Title: Soziale Simulationen


1
Soziale Simulationen
  • Künstliche Gesellschaften und individuelles
    Sozialverhalten

Matthias Schmitt
2
Was sind soziale Simulationen?
Sozialwissenschaft
Informatik
Soziale Simulationen künstliche Gesellschaften
Ökonomie
Psychologie
3
Interessante Fragestellungen
Gesellschaften
Computer
Warum entsteht soziales Verhalten in Gruppen? Was
ist die Voraussetzung dafür? Wie wirken
bestehende Normen?
soziale
Simulationen
Individuen
Menschen
Warum ist der einzelne sozial? Wie entsteht
Kooperation?
4
Interessante Fragen II
  • Entstehung und Verbreitung von Normen, Allianzen,
    Kooperationen, Gruppenbildung und dynamik
  • Kommunikation und Sprache, soziale Interaktion,
    Kultur
  • Institutionen und Politik,
  • Ökonomische Fragestellungen

5
Übersicht
  • Soziale Simulationen mit zellulären Automaten
  • Untersuchung von Normen unter diversen Aspekten
  • Soziales Lernen
  • Spielstrategien und theorie
  • Emotionale Agenten

6
Soziale Simulationen und zelluläre Automaten
  • Segregation als makroskopischer Effekt bei
    mikroskopischer Veränderung
  • Migration, Kultur, Krieg, Handel
  • Entstehung und Wirkung von Normen

7
Die Schelling-Simulation
  • Primitiver zellulärer Automat
  • Fragestellung Entstehung von Segregation in
    nicht-rassistischen Gesellschaften

8
Modell
  • Zwei antagonistische Typen von Agenten können
    sich bewegen
  • Eine Gefühlsregel implementiert eine lokal
    begrenzte Fitness-Funktion, die dem Agenten eine
    Präferenz für die nächste Bewegung eingibt.

9
Regeln
  • Ist ein Bürger unglücklich aufgrund seiner
    Nachbarn, so wandert er auf ein angrenzendes Feld
    mit besseren Bedingungen
  • Wie empfindlich ein Bürger auf die falschen
    Nachbarn reagiert, kann als Parameter e gewählt
    werden
  • Die falschen Nachbarn können durch gute wieder
    ausgeglichen werden e ergibt sich also aus dem
    Verhältnis der Anzahlen auf den angrenzenden
    Feldern

10
Fragen
  • Wie hängt die Empfindlichkeit eines Bürgers von
    der Neigung des Systems zur Clusterbildung ab?

11
Ergebnisse
  • Das makroskopische Ergebnis (Segregation) ist in
    den überwiegenden Fällen unabhängig von der
    Empfindlichkeit der Bürger
  • obwohl Bürger auch durch komplexe Musterbildung
    zufriedengestellt werden könnten, bilden sich
    grosse, simple Anhäufungen von gleichartigen
    Individuen
  • Dabei ist zu beobachten, dass beispielsweise bei
    einer Präferenz von 55 in den resultierenden
    Clustern eine Majorität von ca. 80 besteht
    (linearer 1D-Automat), wenn die Gruppen genau
    gleich stark sind.
  • Extrem primitiver Automat zeigt emergentes
    Verhalten, das auf reale Situationen bezogen
    werden kann (Bsp. erste Einwanderer in Amerika)

12
Das Sugarscape-Modell
  • Vielfältig einsetzbarer zellulärer Automat
  • Simulation einer Population in einer künstlichen
    Umwelt, die durch Regelwerk repräsentiert wird
  • Primitive, regelbasierte Agentenreaktionen
    erzeugen komplexe Strukturen (Emergenz)
  • Fragestellungen
  • Migration
  • Fortpflanzung
  • Kultur
  • Aggression
  • Eigentumsnorm
  • Handel
  • Krankheit

13
Modell
  • Agenten bewegen sich in einer Landschaft, die
    eine oder mehrere begrenzte, nachwachsende
    Ressource(n) bereitstellt
  • Agenten sind ausgezeichnet durch ihre Sichtweite
    und ihren Verdauungszyklus
  • Untereinander können sie Verhaltensregeln
    (Meme) oder Ressourcen austauschen

14
Leben in Sugarscape
  • Landschaft Torus von 50 x 50 Feldern (periodic
    boundary) mit Von-Neumann-Nachbarschaft
  • Verschiedenen Regionen mit unterschiedlicher
    Zuckermenge
  • Standardregel - G a (G für growth) in jeder
    Stelle regeneriert sich der Zucker mit einer Rate
    a pro Zeiteinheit bis zur maximalen lokalen Menge
  • Agenten sind am Anfang mit Zucker ausgestattet
  • Zucker der nicht gegessen wurde, wird als
    Vermögen bezeichnet (bei Vermögen gibt es keine
    Begrenzung und wird von der Zeit nicht
    beeinflusst)
  • Wenn ein Agent kein Zucker mehr besitzt, stirbt
    er und wird von Sugarscape entfernt
  • Die Agenten haben ein endliches Dasein und ihnen
    ist ein Geschlecht zugewiesen
  • Tragfähigkeit Die Umwelt kann nicht beliebig
    viele Agenten ernähren

15
Beispiel-Simulationszyklus
Bewegungsregel (M)
Fortpflanzungsregel (S)
Kulturübertragungs- regel (K)
  • Kampfregeln (Ca)
  • Handelsregeln (T)
  • Jahreszeitenregeln (Se)
  • ...

Wachstumsregel (G)
16
Grundlegende Regel-Beispiele
  • (M) Schau dich soweit wie möglich um und finde
    die nächste leere Zelle mit max. Zucker. Gehe
    dorthin. Nimm allen Zucker.
  • (S) Falls im fruchtbaren Alter und beide Partner
    genügend Zucker besitzen, wird ein Nachkomme
    erzeugt. Als Partner dienen alle Nachbarn, die
    den Bedingungen genügen. Erbschaftsregeln können
  • (K) Im Gegensatz zur genetischen Ausprägung
    können die Kulturtags während der Lebensspanne
    des Agenten geändert werden
  • Für jeden Nachbarn wird zufällig ein Kulturtag
    ausgewählt und angeglichen. Man kann die
    Population in Völker einteilen, indem man
    bestimmte Übereinstimmungen in der Kultur
    zusammenfasst. Eltern vererben ihre kulturellen
    Traditionen bei unterschiedlicher Meinung
    entscheidet der Zufall.
  • (G) Regenerationsregel, die den Zucker wachsen
    lässt. Im Winter wächst der Zucker langsamer
    als im Sommer, die Jahreszeiten lassen sich auch
    lokal auf der Sugarscape-Welt einstellen, wodurch
    Migrationsverhalten erzeugt werden kann.

17
Exkurs Meme (Dawkins)
  • emanzipierte Informationseinheiten
  • Gedanke oder Idee, Verhalten, Kulturtechniken
    gt Kulturtags
  • Mutation während der Fortpflanzung möglich

18
Fragen
  • Wie wirken sich Beweglichkeit, Zuckerverteilung,
    verschiedene Metabolismen oder Jahreszeiten aus?
    (Migration)
  • Wie wirken sich verschiedene Kulturübertragungsreg
    eln aus? (Kultur)
  • Wie wirken sich Handelsbeziehungen aus? (Handel)
  • Unter welchen Umweltbedingungen entsteht eine
    Eigentumsnorm? (Sozialverhalten)

19
Migration in Sugarscape
  • Agenten konzentrieren sich auf die Orte höchster
    Zuckerkonzentration
  • Durch Jahreszeiten kann ein Zugvogelverhalten
    oder ein Winterschlaf erzeugt werden
  • Besonders günstig natürlich niedriger
    Metabolismus und hoher Sichtradius

20
Kultur in Sugarscape
  • Führt man eine kulturelle Zugehörigkeit ein, so
    nehmen entweder langfristig alle die gleiche
    Kultur an, oder es entstehen Stämme
  • Dieser Zustand ist dann ein Gleichgewichtszustand
  • Je länger der kulturelle Code ist, desto länger
    dauert es bis zum equilibrierten System

21
Handel auf Sugarscape
  • Es wird eine zweite Ressource eingefügt, z.B.
    Gewürz und jeder Agent erhält ein Bedürfnis
    (Metabolismusraten SZ und SG) nach dieser
    Ressource
  • Dieses Bedürfnis hat je nach seiner Wichtigkeit
    Auswirkung auf das Verhalten des Agenten
  • Relative Wichtigkeit, G zu finden

22
Handel auf Sugarscape II
  • Neue Bewegungsregel schaue dich soweit wie
    möglich um und bestimme das Feld, das den meisten
    Profit verspricht. Gehe dorthin und sammle die
    entsprechende Ressource.
  • Ergebnis Pendelbewegung zwischen den Bergen und
    Erschöpfungstod

23
Handel auf Sugarscape III
  • ... We can imagine consumers wandering around a
    large market square with all their possessions on
    their backs. They have chance meeting each other,
    and when two consumers meet, they examine what
    each has to offer to see if they can arrange a
    mutually agreeable trade... (Kreps, 1990,
    zitiert nach Ernst)
  • Wann und mit wem werden die Agenten handeln?
  • Wie wird der Preis bestimmt?
  • Wie groß wird das Handelsvolumen sein?

24
Handelsregeln
  • Bedürfnis w Mangel an Zucker
  • Treffen zwei Agenten aufeinander, berechnen sie
    ihr w wahrheitsgemäß und die folgende Tabelle
    gibt Aufschluss über ihre Handelsverhalten (wA
    wB gt kein Handel)
  • Mit jedem Handel nähern sich beide w an der
    Wohlstand steigt.
  • Handel wird auch stattfinden, wenn es beiden
    Akteuren an derselben Ressource mangelt der
    Agent mit dem relativ geringeren Mangel wird
    durch Bestpreise belohnt

wA gt wB wA gt wB wA lt wB wA lt wB
Aktion A B A B
Kaufen Zucker Gewürz Gewürz Zucker
Verkaufen Gewürz Zucker Zucker Gewürz
25
Preisbestimmung
  • Damit beide profitieren, muss der Preis im
    Intervall wA ... wB liegen. Um Zucker zu
    erhalten, ist A also nicht zu jeden Preis bereit
    der max. Preis ist wA. Alle Preise in diesem
    Intervall wären akzeptabel, aber je näher der
    Preis an einem Ende liegt, desto unfairer der
    Handel.
  • Preis
  • p gt 1 p Einheiten G pro Einheit Z
  • p lt 1 1/p Einheiten Z pro Einheit G

26
Handel Forschungsfragen
  • Entwicklung der Preise und des Handelsvolumens?
  • Individueller Profit und gesellschaftlicher
    Profit?
  • Was passiert bei Auflockerung der neoklassischen
    Annahmen von
  • ewigem Leben
  • konstanten Präferenzen und
  • vollständiger Information
  • Treten die Marktergebnisse der klassischen
    Theorie ein?
  • Stellt sich eine pareto-optimale Verteilung ein?
  • Erreichen Markt und Preis allg. Gleichgewicht?

27
Ergebnisse bei klassischen Agenten
  • Anfängliche Preisvarianz nimmt ab der Preis
    konvergiert
  • Große Schwankungen im Handelsvolumen
  • Bevölkerungskapazität des Systems wird verbessert
  • Ein wirtschaftliches Gleichgewicht entsteht from
    bottom up
  • Aber das theoretische Handelsvolumen wird nie
    erreicht und das Gleichgewicht ist nur bzgl. der
    nächsten Nachbarn optimal.

28
Handel unter dem Gesetz R(60,100)
  • Ein Agent hat keine konstanten Präferenzen mehr,
    scheidet nach einer festgelegten Zeit aus und
    wird durch einen randomisierten Akteur ersetzt
  • Folge Entfernung von jeglichem Gleichgewicht
  • Weitere Variante Hinzunahme von S und
    evolutionäre Änderung von Sichtweite und
    Metabolismus
  • Folge wie in R(60,100)

29
Handel und Kultur
  • Änderung von Präferenzen durch den Kontakt mit
    anderen Akteuren
  • Durch jeden Kontakt mit einem anderen Akteure
    kann sich der Bedarf (Stoffwechsel) an Z und G
    verschieben.
  • Folge Eine enorme Preisschwankung und eine
    konstant hohe Standardabweichung
  • Wohlstandsverteilung
  • Handel verschärft das Wohlstandsgefälle. Im
    Gegensatz zu einem allgemeinen Gleichgewicht
    resultiert dieses nicht allein aus den
    Unterschieden der ursprünglichen Ausstattung,
    sondern auch aus der lokalen Preisheterogenität
  • Veränderung des neoklassischen Modells zugunsten
    einer realitätsnäheren Simulation zeigen eine
    dramatische Entfernung der Lehrbuchmeinung über
    allgemeines Marktverhalten

30
Normemergenz auf Sugarscape
  • Einführung eines Eigentums-Mems, welches das
    Agentenverhalten beeinflusst. Ist es im
    kulturellen Code aktiv, so
  • Wird der Agent Felder, auf die er kommt, als sein
    Eigentum markieren
  • Keinen fremden Zucker aus anderweitig markierten
    Zellen nehmen
  • Optional (nicht in Originalarbeit) der Agent
    wird eine leichte Präferenz für eigene Felder
    haben
  • Der Nachwuchs erhält die Mem-Ausstattung der
    Eltern
  • Einführung eines Sanktionierungs-Mems, dass den
    Agenten dazu veranlasst, alle eventuellen
    Diebstähle (auch die bei fremdem Eigentum)
    innerhalb seiner Sichtweite unter Einsatz einer
    gewissen Zuckermenge seines eigenen Vorrats zu
    bestrafen.

31
Normemergenz auf Sugarscape II
  • Startbedingung
  • Ohne Sanktionierungsmöglichkeit
  • 50 der Bevölkerung hat Eigentums-Mem
  • Mem-Übertragungswahrscheinlichkeit 1/11
  • Ergebnis die Populationen sterben aus, sobald
    das Mem verschwunden ist Agenten ohne Mem sind
    zu arm, um sich zu paaren.
  • Populationen mit Mem am Start leben etwas länger
    als solche völlig ohne Mem

32
Normemergenz auf Sugarscape III
  • Startbedingung
  • Sanktionierungsmöglichkeit
  • 50 der Bevölkerung hat Eigentums-Mem
  • Sanktionierung kostet den Strafenden
  • Ergebnis das Eigentums-Mem hat weiterhin
    Schwierigkeiten, sich zu etablieren
  • Grund es besteht ein Trittbrettfahrerproblem
    das Sanktionierungsmem erweist sich als Nachteil
    und stirbt aus

33
Normemergenz auf Sugarscape IV
  • Startbedingung
  • Kostenfreie Sanktionierungsmöglichkeit
  • 50 der Bevölkerung hat Eigentums-Mem
  • Ergebnis das Eigentums-Mem bleibt erhalten und
    sorgt für ein dauerhaftes Überleben der
    Population auch bei hohen Verdauungsraten

34
Normemergenz auf Sugarscape V
  • Ergebnisse
  • Die Durchsetzung einer Norm erfordert billige
    Sanktionierungsmöglichkeiten
  • Andernfalls besteht das Trittbrettfahrerproblem,
    dass Normemergenz verhindert.
  • Populationen ohne Eigentumsnorm sterben aus, wenn
    ihre Umweltbedingungen und ihre Metabolismen
    nicht optimal sind.

35
Normen Entstehen und Wirkung
  • Zusammenfassung
  • Normen können als emergentes Verhalten in
    Sugarscape simuliert werden.
  • Zellularautomaten sind mächtige Werkzeuge zur
    Untersuchung von Artificial Societies
  • Jetzt
  • Normen als Regelsysteme
  • Andere Normerzeugungsmechanismen in verschiedenen
    Simulationssystemen und Modellen

36
Vorgegebene Normen
  • Castelfranchi et al. Norm zur Aggressionskontroll
    e in einem zellulären Automat, dessen Agenten
    Stärke besitzen, die abhängig von ihrer
    Nahrungsaufnahme ist und die bestimmte Felder als
    Eigentum markieren können.
  • Die Nahrung erscheint zufällig auf den Feldern
  • Blind, Strategisch, oder Nonaggression als
    Agentenverhalten implementiert. Attacken kosten
    den Angreifer und den Verteidiger gleichermaßen
    Stärke.
  • Die Nahrungsaufnahme benötigt mehrere Taktzyklen,
    in dieser Zeit kann der essende Agent in den
    ersten beiden Fällen angegriffen werden der
    Stärkere gewinnt, reisst dem schwachen das Futter
    weg und kann selbst den Essvorgang beginnen.
  • Nonaggression bedeutet, dass kein Angriff gegen
    einen Agenten erfolgen darf, der auf seinem
    eigenen Feld isst.

37
Vorgegebene Normen II
  • Ergebnis
  • Normen können Aggression beschränken
  • Normen haben einen positiven Effekt auf die
    durchschnittliche Stärke eines Agenten,
    mindestens genauso effektiv ist wie strategische
    Aggression
  • Bei strategischer Aggression erleiden die
    schwachen Agenten einen Nachteil, weil sie die
    Hauptlast der Aggressionskontrolle tragen (die
    Starken werden ja nie attackiert)
  • Normen haben Auswirkungen auf den Anteil des
    Agenten am gesamten Nahrungsvorkommen, weil
    sowohl vorteilhafte wie unvorteilhafte Attacken
    unterbunden werden und so die Kosten für die
    Aggressionskontrolle gleichmäßiger verteilt
    werden

38
Normentstehung in anderen Modellen
  • Können egoistische Agenten Normen erlernen?
  • Antwort Flentge Ja, solange billige
    Sanktionsmöglichkeiten bestehen
  • Antwort Dawkin Ja, solange sie die gleichen
    Gene haben
  • Antwort Axelrod Ja, wenn die gleichen Agenten
    mehrfach aufeinander stossen
  • Antwort Ito Ja, wenn das Wissen über das
    Verhalten des Einzelnen jedem zugänglich ist
  • Antwort Dörner Ja, wenn sie ein emotionales
    Bedürfnis danach haben

39
Normverbreitung in anderen Algorithmen
  • Die Durchsetzung einer Norm hängt in der Realität
    stark von der Interaktion zwischen den Spielern
    ab, die bisher vernachlässigt wurde.
  • Interaktion bzw. Kommunikation wird in drei
    Formen modelliert
  • Zellularautomat
  • Netzwerk mit power-law Verhalten
  • Zufallsgraph mit poissonverteilten Verbindungen
  • Fragestellung MDT, Einfluss der Lernalgorithmen,
    Einfluss der Konnektivität

40
Power-law-Netzwerk
  • Eine kleine Anzahl Agenten hat eine weit
    überdurchschnittliche Anzahl von Sozialkontakten
  • Ausgehend von einer kleinen Anzahl Kontakte
    werden in jedem Zeitschritt weitere Verbindungen
    geschaffen, wobei Andockstellen bevorzugt werden,
    die bereits von vielen Verbindungen angelaufen
    werden.
  • Normkodierung wie bisher (Bitmuster)

41
Zufallsgraph
  • Jeder Agent hat eine fixe Anzahl Verbindungen,
    die Verbindungen sind poissonverteilt. Bei
    kleiner mittlerer Verbindungszahl existieren
    isolierte Agenten.

Bei beiden Modellen interagiert jeweils ein
zufällig gewählter Akteur via einer seiner
Verbindungen wie folgt Imitation mit einer
gewissen Wahrscheinlichkeit wird das
Gegenüber die Normcodierung übernehmen (oder
umgekehrt), wobei die Wahrscheinlichkeit dafür
von der Hamming-Distanz der Normen abhängen
kann. Individuell ein Agent kann mit einer
gewissen Wahrscheinlicheit seine eigene Meinung
bilden (zufällig).
42
Ergebnis
  • Ohne individuelles Lernen setzt sich in allen
    Interaktionsmodellen eine Norm durch
  • Individuelles Lernen fördert die Koexistenz
    zweier verschiedener Normen
  • Die MDT für den Zufallsgraphen ist im allgemeinen
    deutlich größer als für das PL-Netz (Spezialfall
    durchschnittliche Konnektivität ist 1) Grund
    Die Pfadlänge ist im PL-Netz kürzer.
  • Nähert sich die Konnektivität einem kritischen
    Bereich, so konvergieren Randomnet und Powernet
    gegen eine gemeinsame MDT.
  • Die MDT hat ein Minimum zwischen den Bereichen
    extrem weniger und extrem starker Interaktion.

43
Soziales Lernen
  • Biologische Evolution, individuelles Lernen und
    kulturelle Evolution sind Wege, das gleiche
    Problem zu lösen Koordination zwischen
    Agenteninterner und der Umweltstruktur zu
    erreichen. Sie sind allerdings unterschiedlich
    schnell.
  • Gibt man einer Population die Möglichkeit der
    Umweltveränderung, so können auch komplexe
    Prozesse, die vom Individuum innerhalb seiner
    Lebensspanne nicht gelernt werden können, von der
    Gesellschaft adaptiert werden.
  • Kultur involviert die Fähigkeit, Repräsentationen
    der Umwelt zu erschaffen und so Informationen
    schneller und sicherer weiterzugeben.
  • Fragestellung Erlernen einer Mondphasenvorhersage
    in einer Gesellschaft

44
Relation zwischen den Strukturen und ihre
Möglichkeiten
Umweltstruktur
1. Direktes Lernen durch Umweltbeobachtung
2. Erlernen einer Sprache, um die Relation
zwischen Umwelt- und Kulturstruktur zu beschreiben
Interne Struktur
Kulturelle Struktur
3. Vermitteltes Lernen durch Betrachtung der
kulturellen Struktur
45
Simulation Agenten
  • Die Bewohner sind durch neuronale Netze
    repräsentiert, deren Input sowohl künstliche als
    auch natürliche Muster sein können
  • Ein Zyklus jeder lernt so gut er kann (aus allen
    Bereichen Umwelt und Kultur), erzeugt ein
    Artefakt, erzeugt einen Nachkommen und stirbt. Es
    findet keine genetische Informationsübertragung
    statt.
  • Jeder Nachkomme bekommt ein randomisiertes
    Startnetz.
  • Welches Artefakt als Studienobjekt benutzt wird,
    kann parametrisiert werden (auf Erfolgsbasis
    der letzten Generation oder per Zufall)

46
Simulation II Umwelt
  • Die zu erlernende Regel ist ein simples XOR. Ein
    perfektes Artefakt sähe daher so aus
  • Jede Ziffer kann mit reellen Zahlen von 0..1
    belegt sein die Tabellen sind prototypisch

Mondstatus Tidenstatus
Neumond 1000 01
Erstes Viertel 0100 10
Vollmond 0010 01
Drittes Viertel 0001 10
Mond Tide
N 00 0
E 10 1
V 11 0
D 01 1
Symbolische Repräsentation (Agenten-Intern)
Physikalische Repräsentation
47
Aufbau eines Agenten
Mond-Beschreibungsnetz
Tiden-Beschreibungsnetz
Symbolisch
Symbolisch
Input des Artefakts, Tiden-Anteil
Input des Artefakts, Mond-Anteil
Aktuator
Input durch Beobachtung, Mond-Anteil
Erfahrung
Input durch Erfahrung, Tiden-Anteil
Erfahrung
Artefakt
48
Der Lernprozess
  • Die Agentennetze werden in einem bestimmten
    Verhältnis von direkter und vermittelter
    Beobachtung trainiert.
  • Das Lernen von Artefakten wird bevorzugt, weil
    die natürliche Beobachtung sehr lange dauert.

49
Ergebnis
  • Der Lernprozess verläuft sehr langsam, falls
    keine Präferenz der Nachkommen für die Nutzung
    von Artefakten kompetenter Eltern besteht
  • Mit einer solchen Vorliebe lernt die Gesellschaft
    in einer absehbaren Anzahl von Generationen, sehr
    gute Artefakte herzustellen und die
    durchschnittliche Kompetenz steigt stark an,
    obgleich die Lernfähigkeit nicht zugenommen hat.
  • Gesellschaften, die kulturelle Artefakte
    herstellen, profitieren von diesen und helfen bei
    der Anpassung an die Umwelt die genetische
    Ausstattung ist nicht die einzige Quelle solcher
    Anpassungen.

50
Spieltheoretische Ansätze
  • Spiele eignen sich besonders, um bei Menschen
    (und Maschinen) Verhaltensweisen zu erkennen sie
    erzeugen eine Abstraktion, die eine leichtere
    Mustererkennung möglich macht.
  • Entstehung und Stabilisierung von Kooperation am
    Beispiel des iterierten Gefangenendilemmas
  • Fragestellung Welche Strategien sind in diesem
    Spiel besonders erfolgreich?

51
Das iterierte Gefangenendilemma
  • N Spieler treffen mehrfach eine Entscheidung zu
    kooperieren (C) oder zu defektieren (D).
  • Das Spiel endet nach jedem Zug mit der
    Beendigungswahrscheinlichkeit p 1-w
  • w nennt man Diskontparameter er ist ein Maß für
    die Wichtigkeit des nächsten Zuges
  • Defektionsverhalten wird klar belohnt, falls das
    Gegenüber kooperiert.

C D
C 3 / 3 0 / 5
D 5 / 0 1 / 1
Typische Pay-off-Matrix P
52
Strategien für das Gefangenendilemma
  • TFT Wie du mir, so ich dir
  • TRANQUILIZER Bilde eine Kooperationsphase, dann
    defektiere gelegentlich
  • TESTER Defektiere, dann spiele in Abhängigkeit
    von der Reaktion TFT (nach D) oder spiele CC
    defektiere danach bei jedem zweiten Zug (nach C)

53
Vergleich der Strategien
  • TFT ist die erfolgreichste Strategie, da sie
  • Robust
  • Nachsichtig
  • Durchsichtig
  • ...
  • ist. Sie ist diejenige Strategie, die am
    schwierigsten auszubeuten ist.
  • Der Vergleich der Strategien ist schwierig, weil
    es von der Zusammensetzung der Population
    abhängt, wie erfolgreich eine Strategie ist.

54
Strategiegruppen
  • Eindringen einer Strategie eine Regel erzielt in
    einer homogenen Regelpopulation höhere
    Punktzahlen als die Population.
  • Kollektive Stabilität Zustand, in dem keine
    Regel eindringen kann
  • Kollektiv stabile Populationen können als einzige
    langfristig das Auftreten von Mutanten verkraften

55
Axelrods Theoreme
  1. Wenn w groß genug ist, gibt es keine beste
    Strategie unabhängig von der Strategie des
    anderen Spielers
  2. TFT ist genau dann kollektiv stabil, wenn das
    Spiel lange genug dauert (dabei ist w ist
    abhängig von P)
  3. Jede Strategie, die mit p gt ½ im ersten Zug C
    spielt, kann nur kollektiv stabil sein, wenn w
    hinreichend groß ist
  4. Eine freundliche Strategie ist nur dann kollektiv
    stabil, wenn sie durch eine erste Defektion des
    anderen Spielers provoziert wird
  5. Immer-D ist stabil
  6. Diejenigen Strategien, die in Immer-D als Gruppe
    eindringen können, sind maximal diskriminierend,
    wie z.B. TFT
  7. Wenn ein einzelnes Individuum nicht in eine
    freundliche Gruppe eindringen kann, kann auch
    keine Gruppe eindringen.

56
Schlussfolgerungen
  • Sei nicht neidisch
  • Defektiere nicht als erster
  • Erwidere alle Verhaltensmuster
  • Sei nicht zu raffiniert

1, S. 99ff.
57
Das Nachbarschaftsbegrenzungsmodell
  • Segregation kann mit dem alternativen Modell der
    bounded neighbourhoods untersucht werden.
  • Die Begriffe, die für Strategiegruppen eingeführt
    wurden, können aber hier interessanterweise
    analog genutzt werden.

58
Theoretische Psychologie PSI
  • Nach den Fragen zu normkonformem Verhalten, der
    Rolle der Agenteninteraktion bei dessen Entstehen
    und der Untersuchung des sozialen Lernens sollen
    nun die Motivationen untersucht werden, die ein
    Individuum besitzt, sozial zu werden.
  • Offenbar ist der Mensch kein vollständig
    rationale Subjekt, also kann auch seine
    Motivation bei der Emergenz sozialen Verhaltens
    nicht nur auf rational-egoistische Motive
    zurückgeführt werden.
  • Die theoretische Motivationspsychologie führt
    einen emotionalen Aspekt in die
    Handlungssteuerung der Agenten ein und sorgt so
    für realistischere Modelle.

59
PSI Modellvorstellung
  • Ein Roboter lebt auf einer Insel und benötigt zum
    Überleben Wasser als auch diverse weitere
    Ressourcen.
  • Sein Handlungsrepertoire umfasst verschiedene
    Aktivitäten, die er auf Objekte seiner Umwelt
    anwenden kann.
  • Der Roboter vermag durch korrekte Handlungen,
    seine Bedürfnisse zu befriedigen.

60
PSI Interner Aufbau
61
PSI Funktionsweise
  • PSI basiert auf einer Bedürfnisorientierten
    Motivationsstruktur
  • Emotionale, materielle und informationelle
    Bedürfnisse erzeugen Motivationen, die um die
    Kontrolle über die Steuerung des Organismus
    konkurrieren (Subsumption) die Handlungen hängen
    also vom gerade dominierenden Motiv ab.
  • Da die Sensoren von PSI nicht perfekt sind,
    kommt es zu ungenauer Umweltwahrnehmung.
  • Mit Hilfe eines Protokolls vermag PSI, seine
    Handlungen zu reflektieren und so zu optimieren
    (Lernen).

62
PSI Emotionen als Quelle normativen Verhaltens
  • Setzt man mehrere PSI-Agenten auf die Insel und
    gibt ihnen ein Affiliationsbedürfnis, so das
    andere PSIs durch Aussendung eines
    Legitimitätssignalen (L-Signalen) dieses
    Bedürfnis befriedigen können, so können Normen
    entstehen.
  • Dies geschieht, weil PSIs lernen, L-Signale
    geschickt einzusetzen, d.h. solche Signale
    hauptsächlich nur zu senden, wenn das Gegenüber
    sich erkenntlich zeigt, indem es andere
    Bedürfnisse des Senders befriedigt. Es entstehen
    Kooperation und Hilfsbereitschaft.
  • Gegebenfalls muss ein PSI ein supplikatives
    Signal aussenden, also ein Ankündigungssignal für
    ein potentielles L-Signal. Es entsteht ein
    Handel, der z.B. Hilfe bei der
    Durstbefriedigung gegen die Aussendung von
    L-Signalen tauscht.
  • Das Erlernen von Zielen im Zusammenhang mit
    Affiliationsbedürfnis führt zu engen Beziehungen,
    Liebe zwischen den PSIs, da durch häufigen
    Austausch von L-Signalen das Gegenüber zur Quelle
    derselben wird.

63
Zusammenfassung
  • Eine Vielzahl sozialwissenschaftlicher
    Situationen lässt sich relativ gut simulieren.
  • Inwieweit diese Simulationen reale Tatsachen
    wiederspiegeln, kann nicht abschliessend geklärt
    werden Simulationen können also Hilfe und
    Ideengeneratoren sein, niemals aber die Erhebung
    realer Daten ersetzen. Simulationen machen
    Vorschläge zur Interpretation dieser Daten.
  • Der für AL-Forschung interessante Blickwinkel ist
    die Emergenz komplexen Verhaltens bei minimaler
    Ausstattung der Agenten.
  • Für die Sozialwissenschaften ist die Modellierung
    realer Systeme und die Möglichkeit der
    Thesengenerierung von Bedeutung

64
Quellen
  • 1 Axelrod, R. Die Evolution der Kooperation,
    1984
  • 2 Flentge et al. Modelling the Emergence of
    Possession Norms using Memes, in JASS Vol. 4
    (2001)
  • 3 Schelling, T.S. Dynamic Models of
    Segregation Journal of Mathematical Sociology
    1971 Vol. 1 S. 143-186
  • 4 Epstein, Axtell Growing artificial
    societies 1996
  • 5 Dawkins, R. The selfish gene, 1989
  • 6 Ito, A. How do selfish agents learn to
    cooperate? in Artificial Life V, hrsgg. von
    Adami et al.
  • 7 Conti, R. und Castelfranchi, C.
    Understanding the function of norms in social
    groups through simulation
  • in Simulating social phenomena 1997
  • 8 Nakamaru et al. Spread of two linked social
    norms on complex interaction networks in JOTB
    230 (2004) S. 57ff.
  • 9 Hutchins, E. und Hazlehurst, B. Learning in
    the cultural process in Artificial Life I, 1990
  • 10 Levy, S. Künstliches Leben aus dem
    Computer, 1996
  • 11 Dörner, D. Bauplan für eine Seele, 1996
  • 12 Albert, R. und Barabasi, A. Statistical
    mechanics of complex networks in Review of
    modern Physics, Vol. 74 (2002) S. 47ff.
  • 13 Detje, F. PSI erste Schritte in Richtung
    sozialen Verhaltens, Memo 41 des Instituts für
    th. Psych. Der Uni Bamberg (2001)
Write a Comment
User Comments (0)
About PowerShow.com