Title: Soziale Simulationen
1Soziale Simulationen
- Künstliche Gesellschaften und individuelles
Sozialverhalten
Matthias Schmitt
2Was sind soziale Simulationen?
Sozialwissenschaft
Informatik
Soziale Simulationen künstliche Gesellschaften
Ökonomie
Psychologie
3Interessante Fragestellungen
Gesellschaften
Computer
Warum entsteht soziales Verhalten in Gruppen? Was
ist die Voraussetzung dafür? Wie wirken
bestehende Normen?
soziale
Simulationen
Individuen
Menschen
Warum ist der einzelne sozial? Wie entsteht
Kooperation?
4Interessante Fragen II
- Entstehung und Verbreitung von Normen, Allianzen,
Kooperationen, Gruppenbildung und dynamik - Kommunikation und Sprache, soziale Interaktion,
Kultur - Institutionen und Politik,
- Ökonomische Fragestellungen
5Übersicht
- Soziale Simulationen mit zellulären Automaten
- Untersuchung von Normen unter diversen Aspekten
- Soziales Lernen
- Spielstrategien und theorie
- Emotionale Agenten
6Soziale Simulationen und zelluläre Automaten
- Segregation als makroskopischer Effekt bei
mikroskopischer Veränderung - Migration, Kultur, Krieg, Handel
- Entstehung und Wirkung von Normen
7Die Schelling-Simulation
- Primitiver zellulärer Automat
- Fragestellung Entstehung von Segregation in
nicht-rassistischen Gesellschaften
8Modell
- Zwei antagonistische Typen von Agenten können
sich bewegen - Eine Gefühlsregel implementiert eine lokal
begrenzte Fitness-Funktion, die dem Agenten eine
Präferenz für die nächste Bewegung eingibt.
9Regeln
- Ist ein Bürger unglücklich aufgrund seiner
Nachbarn, so wandert er auf ein angrenzendes Feld
mit besseren Bedingungen - Wie empfindlich ein Bürger auf die falschen
Nachbarn reagiert, kann als Parameter e gewählt
werden - Die falschen Nachbarn können durch gute wieder
ausgeglichen werden e ergibt sich also aus dem
Verhältnis der Anzahlen auf den angrenzenden
Feldern
10Fragen
- Wie hängt die Empfindlichkeit eines Bürgers von
der Neigung des Systems zur Clusterbildung ab?
11Ergebnisse
- Das makroskopische Ergebnis (Segregation) ist in
den überwiegenden Fällen unabhängig von der
Empfindlichkeit der Bürger - obwohl Bürger auch durch komplexe Musterbildung
zufriedengestellt werden könnten, bilden sich
grosse, simple Anhäufungen von gleichartigen
Individuen - Dabei ist zu beobachten, dass beispielsweise bei
einer Präferenz von 55 in den resultierenden
Clustern eine Majorität von ca. 80 besteht
(linearer 1D-Automat), wenn die Gruppen genau
gleich stark sind. - Extrem primitiver Automat zeigt emergentes
Verhalten, das auf reale Situationen bezogen
werden kann (Bsp. erste Einwanderer in Amerika)
12Das Sugarscape-Modell
- Vielfältig einsetzbarer zellulärer Automat
- Simulation einer Population in einer künstlichen
Umwelt, die durch Regelwerk repräsentiert wird - Primitive, regelbasierte Agentenreaktionen
erzeugen komplexe Strukturen (Emergenz) - Fragestellungen
- Migration
- Fortpflanzung
- Kultur
- Aggression
- Eigentumsnorm
- Handel
- Krankheit
13Modell
- Agenten bewegen sich in einer Landschaft, die
eine oder mehrere begrenzte, nachwachsende
Ressource(n) bereitstellt - Agenten sind ausgezeichnet durch ihre Sichtweite
und ihren Verdauungszyklus - Untereinander können sie Verhaltensregeln
(Meme) oder Ressourcen austauschen
14Leben in Sugarscape
- Landschaft Torus von 50 x 50 Feldern (periodic
boundary) mit Von-Neumann-Nachbarschaft - Verschiedenen Regionen mit unterschiedlicher
Zuckermenge - Standardregel - G a (G für growth) in jeder
Stelle regeneriert sich der Zucker mit einer Rate
a pro Zeiteinheit bis zur maximalen lokalen Menge - Agenten sind am Anfang mit Zucker ausgestattet
- Zucker der nicht gegessen wurde, wird als
Vermögen bezeichnet (bei Vermögen gibt es keine
Begrenzung und wird von der Zeit nicht
beeinflusst) - Wenn ein Agent kein Zucker mehr besitzt, stirbt
er und wird von Sugarscape entfernt - Die Agenten haben ein endliches Dasein und ihnen
ist ein Geschlecht zugewiesen - Tragfähigkeit Die Umwelt kann nicht beliebig
viele Agenten ernähren
15Beispiel-Simulationszyklus
Bewegungsregel (M)
Fortpflanzungsregel (S)
Kulturübertragungs- regel (K)
- Kampfregeln (Ca)
- Handelsregeln (T)
- Jahreszeitenregeln (Se)
- ...
Wachstumsregel (G)
16Grundlegende Regel-Beispiele
- (M) Schau dich soweit wie möglich um und finde
die nächste leere Zelle mit max. Zucker. Gehe
dorthin. Nimm allen Zucker. - (S) Falls im fruchtbaren Alter und beide Partner
genügend Zucker besitzen, wird ein Nachkomme
erzeugt. Als Partner dienen alle Nachbarn, die
den Bedingungen genügen. Erbschaftsregeln können - (K) Im Gegensatz zur genetischen Ausprägung
können die Kulturtags während der Lebensspanne
des Agenten geändert werden - Für jeden Nachbarn wird zufällig ein Kulturtag
ausgewählt und angeglichen. Man kann die
Population in Völker einteilen, indem man
bestimmte Übereinstimmungen in der Kultur
zusammenfasst. Eltern vererben ihre kulturellen
Traditionen bei unterschiedlicher Meinung
entscheidet der Zufall. - (G) Regenerationsregel, die den Zucker wachsen
lässt. Im Winter wächst der Zucker langsamer
als im Sommer, die Jahreszeiten lassen sich auch
lokal auf der Sugarscape-Welt einstellen, wodurch
Migrationsverhalten erzeugt werden kann.
17Exkurs Meme (Dawkins)
- emanzipierte Informationseinheiten
- Gedanke oder Idee, Verhalten, Kulturtechniken
gt Kulturtags - Mutation während der Fortpflanzung möglich
18Fragen
- Wie wirken sich Beweglichkeit, Zuckerverteilung,
verschiedene Metabolismen oder Jahreszeiten aus?
(Migration) - Wie wirken sich verschiedene Kulturübertragungsreg
eln aus? (Kultur) - Wie wirken sich Handelsbeziehungen aus? (Handel)
- Unter welchen Umweltbedingungen entsteht eine
Eigentumsnorm? (Sozialverhalten)
19Migration in Sugarscape
- Agenten konzentrieren sich auf die Orte höchster
Zuckerkonzentration - Durch Jahreszeiten kann ein Zugvogelverhalten
oder ein Winterschlaf erzeugt werden - Besonders günstig natürlich niedriger
Metabolismus und hoher Sichtradius
20Kultur in Sugarscape
- Führt man eine kulturelle Zugehörigkeit ein, so
nehmen entweder langfristig alle die gleiche
Kultur an, oder es entstehen Stämme - Dieser Zustand ist dann ein Gleichgewichtszustand
- Je länger der kulturelle Code ist, desto länger
dauert es bis zum equilibrierten System
21Handel auf Sugarscape
- Es wird eine zweite Ressource eingefügt, z.B.
Gewürz und jeder Agent erhält ein Bedürfnis
(Metabolismusraten SZ und SG) nach dieser
Ressource - Dieses Bedürfnis hat je nach seiner Wichtigkeit
Auswirkung auf das Verhalten des Agenten - Relative Wichtigkeit, G zu finden
22Handel auf Sugarscape II
- Neue Bewegungsregel schaue dich soweit wie
möglich um und bestimme das Feld, das den meisten
Profit verspricht. Gehe dorthin und sammle die
entsprechende Ressource. - Ergebnis Pendelbewegung zwischen den Bergen und
Erschöpfungstod
23Handel auf Sugarscape III
- ... We can imagine consumers wandering around a
large market square with all their possessions on
their backs. They have chance meeting each other,
and when two consumers meet, they examine what
each has to offer to see if they can arrange a
mutually agreeable trade... (Kreps, 1990,
zitiert nach Ernst) - Wann und mit wem werden die Agenten handeln?
- Wie wird der Preis bestimmt?
- Wie groß wird das Handelsvolumen sein?
24Handelsregeln
- Bedürfnis w Mangel an Zucker
- Treffen zwei Agenten aufeinander, berechnen sie
ihr w wahrheitsgemäß und die folgende Tabelle
gibt Aufschluss über ihre Handelsverhalten (wA
wB gt kein Handel) - Mit jedem Handel nähern sich beide w an der
Wohlstand steigt. - Handel wird auch stattfinden, wenn es beiden
Akteuren an derselben Ressource mangelt der
Agent mit dem relativ geringeren Mangel wird
durch Bestpreise belohnt
wA gt wB wA gt wB wA lt wB wA lt wB
Aktion A B A B
Kaufen Zucker Gewürz Gewürz Zucker
Verkaufen Gewürz Zucker Zucker Gewürz
25Preisbestimmung
- Damit beide profitieren, muss der Preis im
Intervall wA ... wB liegen. Um Zucker zu
erhalten, ist A also nicht zu jeden Preis bereit
der max. Preis ist wA. Alle Preise in diesem
Intervall wären akzeptabel, aber je näher der
Preis an einem Ende liegt, desto unfairer der
Handel. - Preis
- p gt 1 p Einheiten G pro Einheit Z
- p lt 1 1/p Einheiten Z pro Einheit G
26Handel Forschungsfragen
- Entwicklung der Preise und des Handelsvolumens?
- Individueller Profit und gesellschaftlicher
Profit? - Was passiert bei Auflockerung der neoklassischen
Annahmen von - ewigem Leben
- konstanten Präferenzen und
- vollständiger Information
- Treten die Marktergebnisse der klassischen
Theorie ein? - Stellt sich eine pareto-optimale Verteilung ein?
- Erreichen Markt und Preis allg. Gleichgewicht?
27Ergebnisse bei klassischen Agenten
- Anfängliche Preisvarianz nimmt ab der Preis
konvergiert - Große Schwankungen im Handelsvolumen
- Bevölkerungskapazität des Systems wird verbessert
- Ein wirtschaftliches Gleichgewicht entsteht from
bottom up - Aber das theoretische Handelsvolumen wird nie
erreicht und das Gleichgewicht ist nur bzgl. der
nächsten Nachbarn optimal.
28Handel unter dem Gesetz R(60,100)
- Ein Agent hat keine konstanten Präferenzen mehr,
scheidet nach einer festgelegten Zeit aus und
wird durch einen randomisierten Akteur ersetzt - Folge Entfernung von jeglichem Gleichgewicht
- Weitere Variante Hinzunahme von S und
evolutionäre Änderung von Sichtweite und
Metabolismus - Folge wie in R(60,100)
29Handel und Kultur
- Änderung von Präferenzen durch den Kontakt mit
anderen Akteuren - Durch jeden Kontakt mit einem anderen Akteure
kann sich der Bedarf (Stoffwechsel) an Z und G
verschieben. - Folge Eine enorme Preisschwankung und eine
konstant hohe Standardabweichung - Wohlstandsverteilung
- Handel verschärft das Wohlstandsgefälle. Im
Gegensatz zu einem allgemeinen Gleichgewicht
resultiert dieses nicht allein aus den
Unterschieden der ursprünglichen Ausstattung,
sondern auch aus der lokalen Preisheterogenität - Veränderung des neoklassischen Modells zugunsten
einer realitätsnäheren Simulation zeigen eine
dramatische Entfernung der Lehrbuchmeinung über
allgemeines Marktverhalten
30Normemergenz auf Sugarscape
- Einführung eines Eigentums-Mems, welches das
Agentenverhalten beeinflusst. Ist es im
kulturellen Code aktiv, so - Wird der Agent Felder, auf die er kommt, als sein
Eigentum markieren - Keinen fremden Zucker aus anderweitig markierten
Zellen nehmen - Optional (nicht in Originalarbeit) der Agent
wird eine leichte Präferenz für eigene Felder
haben - Der Nachwuchs erhält die Mem-Ausstattung der
Eltern - Einführung eines Sanktionierungs-Mems, dass den
Agenten dazu veranlasst, alle eventuellen
Diebstähle (auch die bei fremdem Eigentum)
innerhalb seiner Sichtweite unter Einsatz einer
gewissen Zuckermenge seines eigenen Vorrats zu
bestrafen.
31Normemergenz auf Sugarscape II
- Startbedingung
- Ohne Sanktionierungsmöglichkeit
- 50 der Bevölkerung hat Eigentums-Mem
- Mem-Übertragungswahrscheinlichkeit 1/11
- Ergebnis die Populationen sterben aus, sobald
das Mem verschwunden ist Agenten ohne Mem sind
zu arm, um sich zu paaren. - Populationen mit Mem am Start leben etwas länger
als solche völlig ohne Mem
32Normemergenz auf Sugarscape III
- Startbedingung
- Sanktionierungsmöglichkeit
- 50 der Bevölkerung hat Eigentums-Mem
- Sanktionierung kostet den Strafenden
- Ergebnis das Eigentums-Mem hat weiterhin
Schwierigkeiten, sich zu etablieren - Grund es besteht ein Trittbrettfahrerproblem
das Sanktionierungsmem erweist sich als Nachteil
und stirbt aus
33Normemergenz auf Sugarscape IV
- Startbedingung
- Kostenfreie Sanktionierungsmöglichkeit
- 50 der Bevölkerung hat Eigentums-Mem
- Ergebnis das Eigentums-Mem bleibt erhalten und
sorgt für ein dauerhaftes Überleben der
Population auch bei hohen Verdauungsraten
34Normemergenz auf Sugarscape V
- Ergebnisse
- Die Durchsetzung einer Norm erfordert billige
Sanktionierungsmöglichkeiten - Andernfalls besteht das Trittbrettfahrerproblem,
dass Normemergenz verhindert. - Populationen ohne Eigentumsnorm sterben aus, wenn
ihre Umweltbedingungen und ihre Metabolismen
nicht optimal sind.
35Normen Entstehen und Wirkung
- Zusammenfassung
- Normen können als emergentes Verhalten in
Sugarscape simuliert werden. - Zellularautomaten sind mächtige Werkzeuge zur
Untersuchung von Artificial Societies - Jetzt
-
- Normen als Regelsysteme
- Andere Normerzeugungsmechanismen in verschiedenen
Simulationssystemen und Modellen
36Vorgegebene Normen
- Castelfranchi et al. Norm zur Aggressionskontroll
e in einem zellulären Automat, dessen Agenten
Stärke besitzen, die abhängig von ihrer
Nahrungsaufnahme ist und die bestimmte Felder als
Eigentum markieren können. - Die Nahrung erscheint zufällig auf den Feldern
- Blind, Strategisch, oder Nonaggression als
Agentenverhalten implementiert. Attacken kosten
den Angreifer und den Verteidiger gleichermaßen
Stärke. - Die Nahrungsaufnahme benötigt mehrere Taktzyklen,
in dieser Zeit kann der essende Agent in den
ersten beiden Fällen angegriffen werden der
Stärkere gewinnt, reisst dem schwachen das Futter
weg und kann selbst den Essvorgang beginnen. - Nonaggression bedeutet, dass kein Angriff gegen
einen Agenten erfolgen darf, der auf seinem
eigenen Feld isst.
37Vorgegebene Normen II
- Ergebnis
- Normen können Aggression beschränken
- Normen haben einen positiven Effekt auf die
durchschnittliche Stärke eines Agenten,
mindestens genauso effektiv ist wie strategische
Aggression - Bei strategischer Aggression erleiden die
schwachen Agenten einen Nachteil, weil sie die
Hauptlast der Aggressionskontrolle tragen (die
Starken werden ja nie attackiert) - Normen haben Auswirkungen auf den Anteil des
Agenten am gesamten Nahrungsvorkommen, weil
sowohl vorteilhafte wie unvorteilhafte Attacken
unterbunden werden und so die Kosten für die
Aggressionskontrolle gleichmäßiger verteilt
werden
38Normentstehung in anderen Modellen
- Können egoistische Agenten Normen erlernen?
- Antwort Flentge Ja, solange billige
Sanktionsmöglichkeiten bestehen - Antwort Dawkin Ja, solange sie die gleichen
Gene haben - Antwort Axelrod Ja, wenn die gleichen Agenten
mehrfach aufeinander stossen - Antwort Ito Ja, wenn das Wissen über das
Verhalten des Einzelnen jedem zugänglich ist - Antwort Dörner Ja, wenn sie ein emotionales
Bedürfnis danach haben
39Normverbreitung in anderen Algorithmen
- Die Durchsetzung einer Norm hängt in der Realität
stark von der Interaktion zwischen den Spielern
ab, die bisher vernachlässigt wurde. - Interaktion bzw. Kommunikation wird in drei
Formen modelliert - Zellularautomat
- Netzwerk mit power-law Verhalten
- Zufallsgraph mit poissonverteilten Verbindungen
- Fragestellung MDT, Einfluss der Lernalgorithmen,
Einfluss der Konnektivität
40Power-law-Netzwerk
- Eine kleine Anzahl Agenten hat eine weit
überdurchschnittliche Anzahl von Sozialkontakten - Ausgehend von einer kleinen Anzahl Kontakte
werden in jedem Zeitschritt weitere Verbindungen
geschaffen, wobei Andockstellen bevorzugt werden,
die bereits von vielen Verbindungen angelaufen
werden. - Normkodierung wie bisher (Bitmuster)
41Zufallsgraph
- Jeder Agent hat eine fixe Anzahl Verbindungen,
die Verbindungen sind poissonverteilt. Bei
kleiner mittlerer Verbindungszahl existieren
isolierte Agenten.
Bei beiden Modellen interagiert jeweils ein
zufällig gewählter Akteur via einer seiner
Verbindungen wie folgt Imitation mit einer
gewissen Wahrscheinlichkeit wird das
Gegenüber die Normcodierung übernehmen (oder
umgekehrt), wobei die Wahrscheinlichkeit dafür
von der Hamming-Distanz der Normen abhängen
kann. Individuell ein Agent kann mit einer
gewissen Wahrscheinlicheit seine eigene Meinung
bilden (zufällig).
42Ergebnis
- Ohne individuelles Lernen setzt sich in allen
Interaktionsmodellen eine Norm durch - Individuelles Lernen fördert die Koexistenz
zweier verschiedener Normen - Die MDT für den Zufallsgraphen ist im allgemeinen
deutlich größer als für das PL-Netz (Spezialfall
durchschnittliche Konnektivität ist 1) Grund
Die Pfadlänge ist im PL-Netz kürzer. - Nähert sich die Konnektivität einem kritischen
Bereich, so konvergieren Randomnet und Powernet
gegen eine gemeinsame MDT. - Die MDT hat ein Minimum zwischen den Bereichen
extrem weniger und extrem starker Interaktion.
43Soziales Lernen
- Biologische Evolution, individuelles Lernen und
kulturelle Evolution sind Wege, das gleiche
Problem zu lösen Koordination zwischen
Agenteninterner und der Umweltstruktur zu
erreichen. Sie sind allerdings unterschiedlich
schnell. - Gibt man einer Population die Möglichkeit der
Umweltveränderung, so können auch komplexe
Prozesse, die vom Individuum innerhalb seiner
Lebensspanne nicht gelernt werden können, von der
Gesellschaft adaptiert werden. - Kultur involviert die Fähigkeit, Repräsentationen
der Umwelt zu erschaffen und so Informationen
schneller und sicherer weiterzugeben. - Fragestellung Erlernen einer Mondphasenvorhersage
in einer Gesellschaft
44Relation zwischen den Strukturen und ihre
Möglichkeiten
Umweltstruktur
1. Direktes Lernen durch Umweltbeobachtung
2. Erlernen einer Sprache, um die Relation
zwischen Umwelt- und Kulturstruktur zu beschreiben
Interne Struktur
Kulturelle Struktur
3. Vermitteltes Lernen durch Betrachtung der
kulturellen Struktur
45Simulation Agenten
- Die Bewohner sind durch neuronale Netze
repräsentiert, deren Input sowohl künstliche als
auch natürliche Muster sein können - Ein Zyklus jeder lernt so gut er kann (aus allen
Bereichen Umwelt und Kultur), erzeugt ein
Artefakt, erzeugt einen Nachkommen und stirbt. Es
findet keine genetische Informationsübertragung
statt. - Jeder Nachkomme bekommt ein randomisiertes
Startnetz. - Welches Artefakt als Studienobjekt benutzt wird,
kann parametrisiert werden (auf Erfolgsbasis
der letzten Generation oder per Zufall)
46Simulation II Umwelt
- Die zu erlernende Regel ist ein simples XOR. Ein
perfektes Artefakt sähe daher so aus - Jede Ziffer kann mit reellen Zahlen von 0..1
belegt sein die Tabellen sind prototypisch
Mondstatus Tidenstatus
Neumond 1000 01
Erstes Viertel 0100 10
Vollmond 0010 01
Drittes Viertel 0001 10
Mond Tide
N 00 0
E 10 1
V 11 0
D 01 1
Symbolische Repräsentation (Agenten-Intern)
Physikalische Repräsentation
47Aufbau eines Agenten
Mond-Beschreibungsnetz
Tiden-Beschreibungsnetz
Symbolisch
Symbolisch
Input des Artefakts, Tiden-Anteil
Input des Artefakts, Mond-Anteil
Aktuator
Input durch Beobachtung, Mond-Anteil
Erfahrung
Input durch Erfahrung, Tiden-Anteil
Erfahrung
Artefakt
48Der Lernprozess
- Die Agentennetze werden in einem bestimmten
Verhältnis von direkter und vermittelter
Beobachtung trainiert. - Das Lernen von Artefakten wird bevorzugt, weil
die natürliche Beobachtung sehr lange dauert.
49Ergebnis
- Der Lernprozess verläuft sehr langsam, falls
keine Präferenz der Nachkommen für die Nutzung
von Artefakten kompetenter Eltern besteht - Mit einer solchen Vorliebe lernt die Gesellschaft
in einer absehbaren Anzahl von Generationen, sehr
gute Artefakte herzustellen und die
durchschnittliche Kompetenz steigt stark an,
obgleich die Lernfähigkeit nicht zugenommen hat. - Gesellschaften, die kulturelle Artefakte
herstellen, profitieren von diesen und helfen bei
der Anpassung an die Umwelt die genetische
Ausstattung ist nicht die einzige Quelle solcher
Anpassungen.
50Spieltheoretische Ansätze
- Spiele eignen sich besonders, um bei Menschen
(und Maschinen) Verhaltensweisen zu erkennen sie
erzeugen eine Abstraktion, die eine leichtere
Mustererkennung möglich macht. - Entstehung und Stabilisierung von Kooperation am
Beispiel des iterierten Gefangenendilemmas - Fragestellung Welche Strategien sind in diesem
Spiel besonders erfolgreich?
51Das iterierte Gefangenendilemma
- N Spieler treffen mehrfach eine Entscheidung zu
kooperieren (C) oder zu defektieren (D). - Das Spiel endet nach jedem Zug mit der
Beendigungswahrscheinlichkeit p 1-w - w nennt man Diskontparameter er ist ein Maß für
die Wichtigkeit des nächsten Zuges - Defektionsverhalten wird klar belohnt, falls das
Gegenüber kooperiert.
C D
C 3 / 3 0 / 5
D 5 / 0 1 / 1
Typische Pay-off-Matrix P
52Strategien für das Gefangenendilemma
- TFT Wie du mir, so ich dir
- TRANQUILIZER Bilde eine Kooperationsphase, dann
defektiere gelegentlich - TESTER Defektiere, dann spiele in Abhängigkeit
von der Reaktion TFT (nach D) oder spiele CC
defektiere danach bei jedem zweiten Zug (nach C)
53Vergleich der Strategien
- TFT ist die erfolgreichste Strategie, da sie
- Robust
- Nachsichtig
- Durchsichtig
- ...
- ist. Sie ist diejenige Strategie, die am
schwierigsten auszubeuten ist. - Der Vergleich der Strategien ist schwierig, weil
es von der Zusammensetzung der Population
abhängt, wie erfolgreich eine Strategie ist.
54Strategiegruppen
- Eindringen einer Strategie eine Regel erzielt in
einer homogenen Regelpopulation höhere
Punktzahlen als die Population. - Kollektive Stabilität Zustand, in dem keine
Regel eindringen kann - Kollektiv stabile Populationen können als einzige
langfristig das Auftreten von Mutanten verkraften
55Axelrods Theoreme
- Wenn w groß genug ist, gibt es keine beste
Strategie unabhängig von der Strategie des
anderen Spielers - TFT ist genau dann kollektiv stabil, wenn das
Spiel lange genug dauert (dabei ist w ist
abhängig von P) - Jede Strategie, die mit p gt ½ im ersten Zug C
spielt, kann nur kollektiv stabil sein, wenn w
hinreichend groß ist - Eine freundliche Strategie ist nur dann kollektiv
stabil, wenn sie durch eine erste Defektion des
anderen Spielers provoziert wird - Immer-D ist stabil
- Diejenigen Strategien, die in Immer-D als Gruppe
eindringen können, sind maximal diskriminierend,
wie z.B. TFT - Wenn ein einzelnes Individuum nicht in eine
freundliche Gruppe eindringen kann, kann auch
keine Gruppe eindringen.
56Schlussfolgerungen
- Sei nicht neidisch
- Defektiere nicht als erster
- Erwidere alle Verhaltensmuster
- Sei nicht zu raffiniert
1, S. 99ff.
57Das Nachbarschaftsbegrenzungsmodell
- Segregation kann mit dem alternativen Modell der
bounded neighbourhoods untersucht werden. - Die Begriffe, die für Strategiegruppen eingeführt
wurden, können aber hier interessanterweise
analog genutzt werden.
58Theoretische Psychologie PSI
- Nach den Fragen zu normkonformem Verhalten, der
Rolle der Agenteninteraktion bei dessen Entstehen
und der Untersuchung des sozialen Lernens sollen
nun die Motivationen untersucht werden, die ein
Individuum besitzt, sozial zu werden. - Offenbar ist der Mensch kein vollständig
rationale Subjekt, also kann auch seine
Motivation bei der Emergenz sozialen Verhaltens
nicht nur auf rational-egoistische Motive
zurückgeführt werden. - Die theoretische Motivationspsychologie führt
einen emotionalen Aspekt in die
Handlungssteuerung der Agenten ein und sorgt so
für realistischere Modelle.
59PSI Modellvorstellung
- Ein Roboter lebt auf einer Insel und benötigt zum
Überleben Wasser als auch diverse weitere
Ressourcen. - Sein Handlungsrepertoire umfasst verschiedene
Aktivitäten, die er auf Objekte seiner Umwelt
anwenden kann. - Der Roboter vermag durch korrekte Handlungen,
seine Bedürfnisse zu befriedigen.
60PSI Interner Aufbau
61PSI Funktionsweise
- PSI basiert auf einer Bedürfnisorientierten
Motivationsstruktur - Emotionale, materielle und informationelle
Bedürfnisse erzeugen Motivationen, die um die
Kontrolle über die Steuerung des Organismus
konkurrieren (Subsumption) die Handlungen hängen
also vom gerade dominierenden Motiv ab. - Da die Sensoren von PSI nicht perfekt sind,
kommt es zu ungenauer Umweltwahrnehmung. - Mit Hilfe eines Protokolls vermag PSI, seine
Handlungen zu reflektieren und so zu optimieren
(Lernen).
62PSI Emotionen als Quelle normativen Verhaltens
- Setzt man mehrere PSI-Agenten auf die Insel und
gibt ihnen ein Affiliationsbedürfnis, so das
andere PSIs durch Aussendung eines
Legitimitätssignalen (L-Signalen) dieses
Bedürfnis befriedigen können, so können Normen
entstehen. - Dies geschieht, weil PSIs lernen, L-Signale
geschickt einzusetzen, d.h. solche Signale
hauptsächlich nur zu senden, wenn das Gegenüber
sich erkenntlich zeigt, indem es andere
Bedürfnisse des Senders befriedigt. Es entstehen
Kooperation und Hilfsbereitschaft. - Gegebenfalls muss ein PSI ein supplikatives
Signal aussenden, also ein Ankündigungssignal für
ein potentielles L-Signal. Es entsteht ein
Handel, der z.B. Hilfe bei der
Durstbefriedigung gegen die Aussendung von
L-Signalen tauscht. - Das Erlernen von Zielen im Zusammenhang mit
Affiliationsbedürfnis führt zu engen Beziehungen,
Liebe zwischen den PSIs, da durch häufigen
Austausch von L-Signalen das Gegenüber zur Quelle
derselben wird.
63Zusammenfassung
- Eine Vielzahl sozialwissenschaftlicher
Situationen lässt sich relativ gut simulieren. - Inwieweit diese Simulationen reale Tatsachen
wiederspiegeln, kann nicht abschliessend geklärt
werden Simulationen können also Hilfe und
Ideengeneratoren sein, niemals aber die Erhebung
realer Daten ersetzen. Simulationen machen
Vorschläge zur Interpretation dieser Daten. - Der für AL-Forschung interessante Blickwinkel ist
die Emergenz komplexen Verhaltens bei minimaler
Ausstattung der Agenten. - Für die Sozialwissenschaften ist die Modellierung
realer Systeme und die Möglichkeit der
Thesengenerierung von Bedeutung
64Quellen
- 1 Axelrod, R. Die Evolution der Kooperation,
1984 - 2 Flentge et al. Modelling the Emergence of
Possession Norms using Memes, in JASS Vol. 4
(2001) - 3 Schelling, T.S. Dynamic Models of
Segregation Journal of Mathematical Sociology
1971 Vol. 1 S. 143-186 - 4 Epstein, Axtell Growing artificial
societies 1996 - 5 Dawkins, R. The selfish gene, 1989
- 6 Ito, A. How do selfish agents learn to
cooperate? in Artificial Life V, hrsgg. von
Adami et al. - 7 Conti, R. und Castelfranchi, C.
Understanding the function of norms in social
groups through simulation - in Simulating social phenomena 1997
- 8 Nakamaru et al. Spread of two linked social
norms on complex interaction networks in JOTB
230 (2004) S. 57ff. - 9 Hutchins, E. und Hazlehurst, B. Learning in
the cultural process in Artificial Life I, 1990 - 10 Levy, S. Künstliches Leben aus dem
Computer, 1996 - 11 Dörner, D. Bauplan für eine Seele, 1996
- 12 Albert, R. und Barabasi, A. Statistical
mechanics of complex networks in Review of
modern Physics, Vol. 74 (2002) S. 47ff. - 13 Detje, F. PSI erste Schritte in Richtung
sozialen Verhaltens, Memo 41 des Instituts für
th. Psych. Der Uni Bamberg (2001)