Title: Results of Psi research
1Results of Psi research
Results of three years of psi research were
condensed on 12 posters for students of the
Georg-Elias-Müller Institute of Psychology,
Göttingen, in June 2000 at an Institutes garden
party. Many students were interested in the yield
of studies on the paranormal to which they had
contributed as participants. More results than
were shown had been obtained, so I continued
their documentation in poster form. Each foil
contains one or two graphs visualizing the result
of some particular part of this project. The text
within foils first briefly explains what is
shown, the question of why the study was made is
then answered, conclusions are provided in
concise form. I am considering to utilize this
material for an account of my research in book
form. The foils may serve as textbook boxes,
but they can do more They can serve as
full-fledged summaries of the books sections and
chapters. They will be embedded, of course, in
systematic context necessary for correctly
relating this project to the history and present
state of parapsychological ideas and research.
Unlike usual textbook boxes, however, readers may
obtain all essential information by merely
working through the foils in succession which
should be intelligible, in principle, without
additional information. The book will be written
in German first, an English translation will
follow. Suggestions for improving this enterprise
are welcome. Suitbert Ertel, Prof. em. 25 July
2000
2Wozu Psi-Forschungam GEM-Institut für
Psychologie?
Seit 1997 wird an unserem Institut
parapsychologisch geforscht. Ist das nicht
anstößig? Schlagen Sie HilgardAtkinson auf S.
161 auf, das Lehrbuch, das den Studierenden an
unserem Institut seit je zur Einführung in die
Psychologie empfohlen wird. Dort finden Sie
gegenüber diesem Thema, was selbst in der
Wissenschaft oft fehlt, Toleranz. It is
desirable to keep an open mind about issues that
permit empirical demonstration. Die Psychologie
mit der Vorsilbe Para liegt an der Grenze zur
Standardlehre, nicht jenseits von ihr.
Main-stream-Vertreter der Standardlehre dürfen
und sollen über die Grenze schauen, auch wenn es
noch nicht genügend kompetente Stimmen gibt, die
diese Thematik in die normale Lehre übernehmen
würden. Ob Parapsychologie in Zukunft
gewissermaßen als Nebenfluss in den Hauptstrom
der Psychologie einmünden wird, hängt davon ab,
ob der noch bestehende Deich zwischen Strom und
Nebenfluss von der Menge des aufquellenden
Wassers, also von den parapsychologischen
Forschungsergebnissen, überflutet werden wird.
Die Göttinger Forschung wird von solcher Hoffnung
getragen.
Psi wird im folgenden oft als Fachterminus
gebrauchtPsi is a general term to identify a
persons extra-sensorimotor communication with
the environment (aus Wolmans Handbook of
Parapsychology, 1977, dem kompetentesten
Übersichtswerk zu diesem Thema, in unserer
Institutsbibliothek greifbar). Psi ist ein
mysteriöser Begriff, so wie Gravitation heute
noch ein schwer umschreibbarer Begriff ist,
selbst für Physiker. Das Mysteriöse an einem
Begriff ist aber kein Grund für unsere Ratio,
sich ihm gegenüber erhaben zu fühlen.
Gravitation setzt sich durch, was immer die Ratio
aus ihr macht wir fallen hin, wenn wir
ausrutschen. Auch Psi setzt sich durch, was immer
wir aus diesem Begriff machen. Zögernd nimmt man
Psi erst zur Kenntnis, wenn der Effekt
spektakulär wird (wenn z.B.eine Mutter auf die
Stunde genau über den Unfall ihres Kindes in der
Ferne erschrickt (Telepathie). Aber nicht nur in
Not und Gefahr spielt Mysteriöses im
Hintergrund eine Rolle. Wie gut z.B., dass der
Regen herunterkommt, nicht oben bleibt
(Gravitation). Die Vorteile von Psi vermuten
Experten u.a. dort, wo neue Ideen auf uns
herunterkommen. Kreative Künstler sind die
besten Probanden in Psi-Experimenten.
Parapsychologische Forschung will extrem weiße
Flächen auf der Landkarte unseres Wissens
erschließen. Wer diese Forschung betreibt, wird
mit Spannung und Überraschung belohnt wie selten
in orthodoxeren Forschungsprojekten.
Haben Sie nur wenig Zeit, dann genügt es, wenn
Sie sich mit folgenden Poster-Komponenten
vertraut machen -- Das Pingpong-Testverfahren
(1)-- Wie zuverlässig misst der Pingpong-Test?
(2) -- Jedes neue Studiensemester bringt
Psi-Potential ins Institut (3) Haben Sie mehr
Zeit, dann können Sie Weiteres erkunden. Jeder
der übrigen Teile steht für sich, eine
Reihenfolge brauchen Sie nicht zu beachten.
Lassen Sie sich von den Überschriften und von
Ihrem Interesse leiten. Weitere Erläuterungen
gibt gern der VersuchsleiterWenn Sie sich selbst
mal psi-testen lassen wollen, teilen Sie es ihm
mit. Sechs mal 15 Minuten, also 1 ½ Heimstunden
sind anzusetzen. Eine ausführliche individuelle
Auswertung mit Rückmeldung des Ergebnisses wird
erfolgen.
Verantwortlich Suitbert Ertel, Prof. em,
sertel_at_uni-tingen.de
3Das Pingpong-Testverfahren
Testziel Ermittlung einer hypothetischen
Psi-Fähigkeit.Das Besondere dieser Fähigkeit
ist die Aufnahme und Weitergabe von Informationen
ohne erkennbaren Einsatz einer sensomotorischen
Übermittlung, die einem Informationstransfer
normalerweise zugrunde liegt. Der Ausdruck
Psi-Fähigkeit lässt sich bei Bedarf durch Termini
wie ASW-Begabung (AußerSinnliche Wahrnehmung),
paramentale oder transliminale Begabung
ersetzen. Material In einem undurchsichtigen
Beutel befinden sich 50 Pingpong-Bälle. Auf
diesen Bällen sind die Zahlen 1 bis 5 geschrieben
(ähnlich wie auf den Kugeln, die bei der
Lottozahl-Ziehung verwendet werden). Jede Zahl
kommt auf 10 Bällen vor. Der Proband erhält eine
mündliche und schriftliche Anleitung und
verwendet ein Protokollblatt zum Eintragen
geratener und gezogener Zahlen (s.
Durchführung). Durchführung Siehe den Kasten
rechts Testvarianten Das hier beschriebene ist
das Einbeutel-Verfahren, das für ein erstes
Screening (Auslese) eingesetzt wird. Mit den
psi-talentierten Probanden wird in der Regel mit
einem Zweibeutel-Verfahren weiter experimentiert.
Bei diesem wird gleichzeitig je ein Ball aus zwei
Beuteln gezogen. Die Einbeutel- und
Zweibeutel-Verfahren, die routinemäßig in
standardisierter Form verwendet werden, werden
für besondere Zwecke modifiziert Z. B werden
farbige Zahlen oder sinnvolle Wörter verwendet,
oder die zu ziehenden Zahlen werden vorgegeben,
oder es sollen möglichst hohe oder niedrige
Zahlen gezogen werden (beim Zweibeutelverfahren
sollen z.B. zwei gleiche Zahlen (Paschs) gezogen
werden usw.). Reliabilität Eine erste
Untersuchung liegt vor (s. Posterteil Wie
zuverlässig misst der Pingpong-Test) Validität Die
Validität des Tests aufzuklären, ist schwierig.
Was der Pingpong-Test misst, darf weder durch
Täuschung, noch durch Bias verunklärt werden
(siehe dazu mehrere Posterteile). Wenn es
allerdings gelingt, diese Artefakte
auszuschließen, dann ist das, was der Test misst,
wohl kaum trivial, vor allem nicht im Hinblick
auf die theoretischen Grundlagen der Psychologie
(Leib-Seele-Problem). Darüber hinaus interessiert
eine Einbindung der Psi-Disposition in den
Katalog der allgemein anerkannten Konstrukte der
Persönlichkeit sowie die mögliche praktische
Nutzung im individuellen und gesellschaftlichen
Leben.
Durchführung im einzelnen Eine Versuchseinheit
(Run)umfasst 60 Trials. Ein Trial läuft ab wie
folgt Der Proband soll aus dem Beutel einen
Pingpong-Ball ziehen. Zunächst rät er, welche
Zahl er auf dem anschließend gezogenen Ball
ablesen wird. Die geratene Zahl schreibt der
Proband in ein Protokollblatt. Darauf wendet und
schüttelt der Proband den Beutel und zieht nach
blinden Tasten einen Ball. Er liest die Zahl ab
und trägt sie ins Protokollblatt ein. Ist es ein
Treffer, wird der Trial mit einem T markiert. Das
Protokollblatt hat vier Zeilen für je 15 Trials.
Die Anzahl der Ts wird für jede Zeile aufsummiert
und eingetragen. Nach jeder Entnahme eines Balls
wird dieser in den Beutel zurückgelegt. Der
Versuch wird zuhause zu beliebigen Zeiten
durchgeführt, der Proband ist gehalten, den
Versuch dann durchzuführen, wenn er allein ist
und sich fit fühlt. Ein Versuch dauert 15-20
Minuten. Zu einem Screening-Test gehören sechs
Runs. Weitere Testserien mit experimentellen
Fragestellungen umfassen 16, 32, oder 50 Runs.
4Wie zuverlässig misst der Pingpong-Test?
Was zeigt die Graphik Die Y-Achse zeigt
Zuverlässigkeitskorrelationen (Spearman-Brown-korr
igiert), die X-Achse zeigt variable Testlängen.
Generell gilt in der Psychodiagnostik Je größer
die Testlänge, umso zuverlässiger der Test.
Insofern war auch für den Pingpong-Test eine
Zunahme der Zuverlässigkeit mit zunehmender
Testlänge zu erwarten, und dies hat sich dann
auch gezeigt Die Zuverlässigkeitskurve steigt
steil an.. Wie wurde die Testlänge konkret
variiert? Insgesamt haben 10 Probanden 32
Sitzungen mit dem Pingpong-Test absolviert, jede
Sitzung mit 60 Trials. Für die Stufe 1 der
Zuverlässigkeit (s. X-Achse) wurden die Treffer
der 1. Sitzung als Ersttest, die der 17. Sitzung
(also der ersten Sitzung nach der Halbzeit) als
Zweittest betrachtet und zwischen Erst- und
Zweittest die Korrelation ermittelt. Für die
Stufe 2 wurden die Treffer der 1.plus 2. Sitzung
als Ersttest, die der 17. plus der 18. Sitzung
als Zweittest und miteinander korreliert.
Entsprechend wurde mit der 3., 4. usw. und mit
der letzten, der Stufe 16, verfahren. Bei der 16.
Stufe wurden die Treffer der gesamten ersten
Hälfte der 32 Sitzungen mit denen der zweiten
Hälfte korreliert. Man sieht, dass schon etwa mit
Stufe 4 das ceiling, der Höchstwert der
Zuverlässigkeit, erreicht wird, also wird man
insgesamt etwa 8 Sitzungen brauchen, um stabile
interindividuelle Unterschiede hinsichtlich
Psi-Fähigkeit erfassen zu können.Was am
Ergebnis eigentlich interessant ist In
Fachkreisen der Psychologie, in denen
parapsychologische Forschung nur peripher
wahrgenommen wird, herrscht das Vorurteil vor,
dass man Psi allenfalls als Mini-Effekt, zudem
als Schwups-wieder-weg-Effekt betrachten und
somit ignorieren dürfe. Dieses Vorurteil haben
Parapsychologen, bei denen sich ungünstige
Messverfahren eingebürgert haben, mit ihren
schwachen und flüchtigen Ergebnissen selbst mit
verschuldet. Doch zeigt die Abbildung, dass beim
Pingpong-Test das Gütekriterium der
Zuverlässigkeit ebenso ausgeprägt ist wie bei den
in der mainstream-Psychologie verbreiteten
Persönlichkeits-verfahren (Fragebögen) (siehe die
entsprechenden Reliabilitäten an der rechten
Y-Achse). Allerdings sind die Pingpong-Reliabilitä
ten der roten Kurve vermutlich etwas überhöht, da
die Stichprobe der 10 Personen zufällig eine
große interindividuelle Streuung der Psi-Effekte
zeigte. Die Gesamtheit der unausgelesenen
Studenten erreicht bei einer Halbierung ihrer
vier Screening-Runs eine Zuverlässigkeit von nur
.67 (siehe blauer Punkt), die gegenüber r.87 bei
X2 in der roten Kurve nach unten abweicht. Im
Normalfall sollten 10 Runs (2 ½ Stunden Testzeit)
den Test optimal zuverlässig machen.
5Jedes neue Studiensemester bringt Psi-Potential
ins Institut
- Was zeigt die Graphik
- Die Punkte repräsentieren Trefferhäufigkeiten,
ausgedrückt als Prozentabweichungen von der
Erwartungslinie MCE (s. (Y-Achse). In einer
Sitzung (60 Ball-Entnahmen) werden bei der
Wahrscheinlichkeit, die geratene Zahl zu treffen
(p 0.20), durchschnittlich 12 zufällige Treffer
erwartet. Wer z.B. 18 Treffer hat, liegt 50 über
der MCE. Die drei letzten Kohorten unserer
Studienanfänger (X-Achse) haben als
Gruppenleistung 10, 10 und 7 Trefferüberschuss
gehabt. Wie signifikant das ist, kann man aus den
hohen Z-Werten ableiten (der Z-Wert der
Gesamtstichprobe ist extrem signifikant p10-16).
Die senkrechten Linien sind Standardabweichungen
oder Vertrauensgrenzen (nur nach unten
gezeichnet). - Einwand der Skeptiker
- Solch einen Versuch darf man doch nicht ohne
Aufsicht von den Probanden allein durchführen
lassen! Der Trefferüberhang kann doch gemogelt
sein! Antwort Kann, das ist richtig. Aber
gibt es einen Grund, den Studierenden eher
Betrugsfähigkeit als Psi-Fähigkeit zuzutrauen,
nicht nur bei vielleicht einzelnen Ausnahmen,
sondern bei der großen Zahl von Probanden, die
nötig ist, um einen solchen Trefferüberhang zu
bewirken? - Weshalb sollten die Studierenden mogeln, zumal
das Mogeln zeitlich viel aufwendiger ist als eine
ehrliche Testdurchführung. - Die Teilnehmer berichten durchweg, sie möchten
gern wissen, ob sie Psi-Fähigkeit besitzen, durch
Mogeln würden sie sich die Chance nehmen, dies zu
erfahren. - Wenn das Mogeln vom Versuchsleiter bemerkt werden
sollte, was für ein Image würde sich da der
Studierende für den Rest seines Studiums zulegen?
- Verteilungsanomalie
- Die hochsignifikanten sog. Heterogenitätsindices
(s. unten Nr. 2) haben zwei Ursachen. Zum einen
ist die Psi-Fähigkeit unter den Studierenden
nicht normal verteilt, anders als das bei den
meisten bekannteren Fähigkeiten.Es gibt Probanden
mit sehr hohen Trefferquoten, Glückspilze
könnte man sagen, etwa 10. Zum anderen gibt es,
was für die Psi-Fähigkeit typisch ist, auch
Pechvögel, deren Trefferquoten signifikant
unter der MCE-Linie liegen, nicht so viele, aber
Glückspilze und Pechvögel zusammen zerren eine
idealisierte Glockenkurve der Verteilung nach
rechts und links auseinander, deshalb kommt es zu
so großen Heterogenitätswerten (in der Graphik
unten).
6Ballzieh-Treffer des psi-talentierten Kannan (16
J) im Längsschnitt
Was zeigt die Graphik Die Punkte und Dreiecke
sind Effektstärken PI (Proportion Index,
Rosenthal Rubin, 1989) von Treffersummen
(Y-Achse), die in 36 Testsitzungen (runs)
ermittelt wurden (X-Achse). Der Zufall ließ pro
Run 12 Treffer erwarten (Horizontallinie, MCE,
mean chance expectancy). Der Proband war Kannan
(16 J), ein hoch psi-talentierter Proband. Seine
Treffer liegen alle über der MCE.Einwand
Das Ergebnis kann doch gemogelt sein!
Antwort Kaum, denn bei dem größeren Teil der
Versuche (siehe die blauen Symbole) hat ein
Aufpasser (S. Ertel) das Protokoll geführt, .Alle
per Trial gezogenen Zahlen auf den Bällen hat
Kannan dem Aufpasser gezeigt, bevor dieser sie
ins Protokoll schrieb. Bei den übrigen Sitzungen
hat Kannans Kusine Usha protokolliert (rote
Symbole). Man weiß nicht, ob Kannan bei ihr
gemogelt hat. Man weiß aber aus den Versuchen mit
Aufpasser Ertel, dass er es nicht nötig hatte,
bei ihr zu mogeln, warum also sollte er? Die
Nummern 1 bis 6 am oberen Graphikrand zeigen
verschiedene Bedingungen an.Am Rande Bei
Bedingung 4 hat S. Ertel die Bälle gezogen,
Kannan hat ihm die Zahlen genannt, die er ziehen
soll, und Kannan hat auch protokolliert. Proband
Ertel liegt signifikant unter der MCE, in anderen
Versuchen entfernt er sich, der kaum
psi-talentiert ist, nur selten bedeutsam von der
MCE-Linie. M.a.W. Talent Kannan hat Untalent
Ertel (Wie? Und warum?) unter dessen sonstiges
Zufallslevel gedrückt. Beim schlechten
Abschneiden Ertels empfand Kannan sichtlich
Schadenfreude!Bei Bedingung 3 waren die Rollen
vertauscht, Ertel nannte Proband Kannan die
Zahlen, die dieser ziehen sollte. Man sieht,
Talent Kannan bleibt in etwa auf seinem sonstigen
Treffer-Niveau, es ist nur geringfügig (nicht
signifikant) reduziert. Schlußfolgerungen Erstens
, der Verdacht misstrauischer Skeptiker, ein so
großer Trefferüberhang wie bei Kannan (bis zu
150) müsse erschwindelt sein, verliert an
Gewicht.Zweitens, die Psi-Fähigkeit ist relativ
stabil. Bei diesem Probanden ist es kein
Schwups-wieder-weg Phänomen.Drittens,
Psi-Prozesse beim einzelnen Individuum können
durch anwesende und mitwirkende Andere stark
beeinflusst werden.Viertens, die überraschende
Wirkung der sozialen Interaktion auf Psi-Prozesse
wirft neue Fragen auf, deren Lösung vielleicht
auch für die normale Sozialpsychologie
interessant sind.
7Sinkt die Trefferquote bei Katarina H., wenn sie
die Bälle unter Aufsicht zieht?
Was zeigt die Graphik Die Y-Achse zeigt
Katarinas Trefferhäufigkeiten über eine Spanne
von 24 Sitzungen (X-Achse), von denen sie die
ersten 16 zuhause, die folgenden 8 Sitzungen
unter der Aufsicht des Experimentators (S. Ertel)
in seinem Dienstzimmer absolvierte. Die mittlere
Zufallserwartung der Treffer liegt hier bei 24
und nicht bei 12, da das Zweibeutel-Verfahren
angewendet wurde, bei dem die Probandin eine
Zielzahl durch gleichzeitige Entnahme von je
einem Ball aus zwei Beuteln zu treffen sucht (20
von 2 mal 6024). Hypothese Hintergrund Die
Heimbedingung wurde beim Pingpong-Test deshalb
eingeführt, weil sich Psi-Phänomene, wie
zahlreichen Berichten früherer Forscher zu
entnehmen ist, leichter manifestieren können,
wenn sich die Probanden wohl fühlen als wenn sie
die Phänomene unter spannungsreichen
Kontrollbedingungen eines Labors produzieren
sollen. Katarina hatte sich schon früher als
talentierte Heim-Teilnehmerin bewährt. Wird sie
unter Kontrollbedingungen ihre Trefferquote
aufrecht erhalten?Die Hypothese war, dass die
Heim-Trefferquote Katarinas unter
Kontrollbedingung zunächst sinken, im Laufe von
Wiederholungen unter Kontrolle aber wieder
steigen werde. Ergebnis Die Hypothese wurde
bestätigt. In der ersten Sitzung unter Kontrolle
sinkt die Trefferquote Katarinas rapide. Mit den
Wiederholungen unter Kontrolle steigt die Quote
allmählich an und gewinnt gegen Ende ihr
vorhergehendes Heim-Trefferniveau
zurück. Schlussfolgerungen Erstens können
Katarinas hohe Trefferzahlen auch im Heimtest von
misstrauischen Kritikern nunmehr nicht leicht
unter den Verdacht eines Schwindels geraten.
Zweitens darf man annehmen, dass sich wohl auch
andere Probanden mit hohen Heim-Trefferquoten
unter Kontrolle ähnlich verhalten würden wie
Katarina (Zunahme an Glaubwürdigkeit der
Pingpong-Ergebnisse generell). Drittens darf die
Heimsituation als Standardbedingung des Tests
beibehalten werden.Viertens ist die hohe
Trefferquote beim Pingpong-Test im Vergleich zu
den Standardverfahren der Parapsychologen, die
alle unter strenger Kontrolle eines
Versuchsleiters stattfinden, z. T. wahrscheinlich
der spannungsfreien Heimbedingung zu verdanken.
8Testen mit 5 oder 10 Zahl-Alternativen?
Was zeigt die Graphik Die Y-Achse zeigt die
Effektstärken von Treffern der Probandinnen
Gabriela G. und Ann-Katrin X., die den
Ball-Versuch bei sich zuhause über insgesamt 82
Sitzungen (Gabriela) bzw. 74 Sitzungen
(Ann-Katrin) durchführten (X-Achse). In den
ersten 50 Sitzungen (Abschnitt 1) hatten beide
Probandinnen aus einem Beutel die Zahlen von 0
bis 9 zu raten und zu ziehen, im zweiten Teil
(Abschnitt 2) wurden die Alternativen auf die
Zahlen 1 bis 5 vermindert. Die Treffersummen sind
natürlich bei 10 und 5 Ziel-Alternativen
verschieden. Doch die Effektstärken-Berechnung
(Rosenthal Rubin, 1989, Proportion Index PI,
hier auf eine Skala von 1 bis 1 umgerechnet)
gestattet einen Vergleich der Treffersummen unter
den beiden Bedingungen auf gleicher Skala. Warum
wurden die Ziel-Alternativen variiert? Am Anfang
des Forschungsprojekts wurde für den
Ball-Zieh-Versuch die gesamte Palette der
einstelligen Zahlen verwendet, weil kein Grund
vorlag, warum man Zahlen ausschließen.sollte.Doch
klagten die Probandinnen unter der
10-Zahlen-Bedingung über zuviel Frustration,
Treffer kamen zu selten. Deshalb wurde zur
5-Zahlen-Bedingung gewechselt. Fünf Alternativen
gab es auch in Rhines Zener-Karten Rateversuch,
der
über Jahrzehnte zum Standard der Erforschung
der außersinnlichen Wahrnehmung (ASW)
wurde. Ergebnisse(1) In der 5-Zahlen-Bedingung
sind bei beiden Probandinnen die Effektstärken
etwas größer als in der 10-Zahlen-Bedingung (s.
Mittelwertslinien).(2) In der 5-Zahlen-Bedingung
ist bei beiden Probandinnen die Streuung der
Effektstärken wesentlich geringer als in der
10-Zahlen-Bedingung.(3) Die Treffer-Streuung ist
bei Ann-Katrin, die ein nur mäßiges Psi-Talent
besitzt, in der 10-Zahlen-Bedingung wesentlich
größer als bei Gabriela, die ein ausgeprägtes
Psi-Talent besitzt. Dieser Unterschied vermindert
sich beträchtlich in der 5-Zahlen-Bedingung.(4)
Beiden Probandinnen machte der 5-Zahlen-Versuch
mehr Spaß. Schlussfolgerung Alle vier
Resultate sprechen dafür, die Ball-Versuche
standardmäßig mit nur 5 Zahlen als
Wahl-Alternativen durchzuführen.
9Ist hintergründig ein Gedächtnisbias wirksam?
Was zeigt die Graphik Die Y-Achse zeigt
Trefferprozente, 20 Treffer sind
zufallserwartet. Auf der X-Achse werden diverse
Bedingungen aufgeführt, verdächtige und
unverdächtige. Es handelt sich um Ergebnisse
einer Überprüfung skeptischer Hypothesen. Die
Hypothesen. Hintergrund Gesetzt den Fall, ein
Proband zieht einen Ball mit einer 5 und legt den
Ball in den Beutel zurück. Er hat vorher die 5
vom Ball abgelesen und aufgeschrieben. Der
Proband rät für den nächsten Zug die 5 noch
einmal. Nun soll er den Beutel gut schütteln und
schüttelt auch, aber so gut dann vielleicht doch
nicht. Die ungefähre Lage des Balles hat sich der
Proband unbewusst gemerkt, treffermotiviert
greift er, sagen wir, in die linke Ecke, wo der
Ball vom letzten Zug liegen müsste. Auf diesem
oder einem ähnlichen Wege wird - ohne jede
Betrugsabsicht - die Trefferquote erhöht. Das
ist eine legitime skeptische Überlegung, die
überprüfbar ist. Zwei Hypothesen sind ableitbar.
(1) Probanden neigen dazu, zuletzt gezogene
Zahlen öfter zu raten als andere Zahlen. Diese
Hypothese wird mit fast jedem Probanden widerlegt
(hier nicht gezeigt) Die zuletzt gezogenen
Zahlen werden viel seltener als früher gezogene
Zahlen geraten. Die folgende zweite Hypothese
wird durch Widerlegung der ersten allerdings noch
nicht berührt (2) Wenn Probanden zuletzt
gezogene Zahlen noch einmal raten, dann erzielen
sie mehr Treffer, als wenn sie andere Zahlen
raten.Diese Hypothese lässt sich verschärfen.
Man sollte annehmen, dass die unbewussten
Gedächtnishilfen vor allem bei Probanden mit
hohen Trefferquoten (bei Glückspilzen - oder
vielleicht Gedächtniskünstlern) zu finden sind.
Also wird angenommen Die hypothetisch unter (2)
postulierte Ungleichheit der Trefferquoten bei
soeben gezogenen gegenüber anderen Zahlen ist bei
Glückspilzen stärker ausgeprägt als bei
Pechvögeln. Ergebnisse Ballzieh-Daten der
N151 Studierenden dienten der Analyse. Die
beiden grauen Säulen stammen von den
Pechvögeln. Auf die beiden roten Säulen der
Glücks-pilze richtet sich der Hauptverdacht,
die homogen rote Säule sollte den größten
Vor-teil durch Gedächtnisunterstützung verraten
(mehr Treffer bei Zahlen, die unmittelbar vorher
gezogen und sofort wieder geraten wurden). Die
Treffer sollten hier häufiger sein als bei der
schraffierten roten Säule, die alle übrigen
Treffer wiedergibt. Doch die homogen rote Säule
ist nicht höher als die schraffierte, sogar etwas
niedriger. Der Un-terschied hat bei den
Pechvögeln die richtige Richtung, aber er ist
nicht signifikant. Schlussfolgerung Die erhöhten
Trefferquoten im Pingpongball-Verfahren lassen
sich durch unzureichendes Beutelschütteln und
durch Gedächtnishilfen nicht erklären.
10Glück durch gutes Gedächtnis?Nochmals Verdacht
auf Artefakt.
Was zeigen die GraphikenDie Y-Achse zeigt die
Trefferprozente der indischer Schülen (N106,
Graphik A) und der deutschen Studenten (N151,
Graphik B), differenziert nach sieben
Trefferrängen (X-Achse) die Gruppe links außen
enthält die trefferschwächsten, die Gruppe rechts
außen die trefferstärksten Probanden (Die Anzahl
Probanden in den Gruppen wurde weitgehend
einander angeglichen (s. magenta-farbige
Zahlenreihe). Eine weitere Differenzierung wird
innerhalb der Treffermengen vorgenommen. Die rote
Kurve steht für Treffer bei den Trials, bei denen
die angekündigte Zahl diejenige war, die der
Proband zuletzt gezogen hatte (zuletzt-gezogene-Za
hlen-raten, zgZr) Die schwarze Kurve steht für
alle übrigen Treffer. Wozu diese
Differenzierung?Die indischen Schüler waren mit
einer ausgeprägten Neigung zu zgZr aufgefallen.
Obgleich bei den Studenten der Verdacht auf einen
zgZr-Bias anderweitig geschwächt war, sollte er
nunmehr bei den Schülern (und bei den Studenten
zum Vergleich nochmals und genauer) geprüft
werden. HypothesenWenn durch zgZr
Treffervorteile entstehen, dann werden diese vor
allem bei trefferstarken Probanden, zunehmend
schwächer, wenn überhaupt, bei trefferschwachen
Probanden auftreten. (1) Trefferstarke Probanden
haben mehr zgZr-Trials als trefferschwache. (2)
Bei trefferstarken Probanden gibt es bei
zgZr-Trials mehr Treffer als bei
trefferschwachen. Ergebnisse(Vorweg Dass die
Kurven ansteigen, ist ein Artefakt der
Probanden-Einteilung nach Trefferniveau und
kein Ergebnis der anstehenden Prüfung).(1) Das
Vorkommen von zgZr steigt weder bei den Studenten
noch bei den Schülern mit dem Trefferniveau
kontinuierlich an (s. grüne Zahlenreihen). Nur
vom vorletzten zum höchsten Trefferrang der
Schüler gibt es einen sprunghaften Anstieg des
zgZr-Vorkommens.(2) Ein Treffervorteil von zgZr
zeigt sich bei den Schülern, hypothesenentsprechen
d am ausge-prägtesten bei den trefferstärksten
Probanden. Die vorausgesagte Zunahme an
Treffervorteil fehlt jedoch bei den Schülern vom
4. zum 2. Trefferrang, d.h. bei etwa der Hälfte
aller Probanden. Bei den Studenten fehlen
Anzeichen von Treffervorteil durch zgZr durchweg,
ein wahrscheinlich zufälliges Abweichen in
Gegenrichtung findet sich bei Trefferrang 6 und
5.Was folgt daraus? Das Ergebnis bei den
Studenten bestätigt frühere negative Ergebnisse
einer Überprüfung auf zgZr-Effekte. Bei den
Schülern findet sich eine Abweichung in Richtung
zgZr-Effekt nur in der trefferstärksten Gruppe
mit 10 Probanden, bei denen zgZr häufiger und
auch mit einem Mehr an Treffern vorkommt. Da
dieser Befund alleine dasteht (die anderen hohen
Trefferränge zeigen ihn nicht), könnte es sich
um einen zufälligen Ausreißerwert handeln. Um
sicher zu gehen, wurden für jede der sieben
Treffer-Rang-Gruppen die Treffer für jeden Trial
der Testserie über die Teilnehmer aufsummiert mit
der Zusatzerwartung, dass die Rang 1-Gruppe, die
mit ihren zgTr Treffern aus dem Rahmen fällt,
auch mit einem Lernanstieg innerhalb der
Testserie aus dem Rahmen fallen müsste, wenn ein
Bias durch gutes Gedächtnis vorliegen sollte.
Doch in der Rang 1-Gruppe ist die Korrelation der
Treffer mit ihrer Trialposition innerhalb der
Zeitreihe (r .096) nicht signifikant, sie liegt
numerisch niedriger als in den unauffälligen
Ranggruppen 2 und 3. FazitAuch bei den
indischen Schülern ist der Trefferüberhang nicht
durch Bias zu erklären.
A
B
11Könnte nicht die taktile Wahrnehmung den
Trefferüberhang bewirken?
Was zeigt die Graphik Die Graphik zeigt
Trefferhäufigkeiten (Y-Achse) als Differenz auf
der prozentualen Skala. Die Differenz 0 liegt vor
bei einer Trefferhäufigkeit von 20 (d.h. bei 12
Treffern unter 60 Ziehungen von fünf ziehbaren
Zahlen). 10 Überhang auf der Differenz-Skala der
Graphik liegen vor bei 30 Treffern usw. Die
Treffer wurden für jeden der 60 Trials (X-Achse)
über alle Personen und alle Runs gemittelt,
sowohl für die 716 Runs der Gesamtheit der 151
Studenten (untere Kurve), als auch für
ausgelesene 227 trefferstarke Runs, bei denen 15
und mehr Treffer erzielt wurden (obere Kurve).
Warum diese Analyse? Skeptische Betrachter der
Ergebnisse des Pingpong-Ball-Versuchs werden eine
Überprüfung des folgenden Einwands fordern Der
Trefferüberhang wird vielleicht durch taktile
Wahrnehmung (Differenzierung der Schrift auf den
Bällen durch Berührung mit den Fingerspitzen)
hervorgerufen, unterstützt vielleicht von
unbewussten Gedächtnishilfen (Proband prägt sich
die unterschiedlichen Muster ein). Gegen diesen
Einwand sprechen inzwischen manche Befunde, so
die Neigung zu guten Fehlern (wenn eine
gewünschte 1 z.B.verfehlt wird, dann hat die 2
eine größere Chance gezogen zu werden als die 5).
Auch das Vorkommen wunschwidriger
Treffer-Defizite (psi-missing) spricht gegen ein
Artefakt durch bekannte psychische Funktionen
(sensory leakage), denn unsere Sinne und unser
Gedächtnis unterstützen eine veridikale
(richtige) und bedürfnis-befriedigende
Repräsentation der Wirklichkeit, zumindest nicht
eine unseren Wünschen und der Wirklichkeit
diametral entgegengesetzte. Doch lässt sich
der Einwand auch gezielter überprüfen. Denn wenn
der Proband beim Ballziehen unbewusst sensorische
und mnestische Hilfen einsetzt, dann können diese
nicht schon am Anfang einer Versuchssitzung
wirksam sein. Man kann ein Gefühl für minutiöse
taktile Unterschiede, wenn überhaupt, nur
allmählich im Laufe einer Versuchssitzung
erwerben. Jedes Lernen braucht Zeit. Der
Skeptiker muss also mit seinem Einwand einen
Anstieg der Trefferzahlen zwischen dem 1. bis zum
60. Trial (eine Lernkurve) erwarten. Ergebnis
Die Trefferzahlen der Gesamtstichprobe (untere
Kurve) zeigen keinen Lern-anstieg. Wie aber, wenn
man nur die am meisten verdächtigten Runs, solche
mit ausgeprägtem Trefferüberhang, auswertet?
Auch diese Fälle zeigen keinerlei Anstieg im
Laufe einer Versuchssitzung (obere
Kurve).Schlussfolgerung Die Befunde
widersprechen der Annahme, dass ein
Trefferüberhang in den Pingpong-Ball-Versuchen
auf Sinneseindrücke oder Gedächtnishilfen
zurückzuführen sei.
12 Wie groß sind die Effektstärken der Treffer?
Was zeigt die Graphik Die X-Achse zeigt die
Effektstärke in einer neuartigen Version. Der
Testauswerter hat sie auf der Basis eines
Algorithmus von Roger Nelson entwickelt. Sie
macht die Testökonomie zum Kriterium, indem
gefragt wird, wie viele Mann-Stunden an Arbeit
aufgebracht werden müssen, bis das Verfahren
einen signifikanten Effekt (p.05 ) hervorbringt.
Dabei wird die Testzeit eines Probanden und der
weiteren am Versuch beteiligten Personen (des
Versuchsleiters meistens) zusammengezählt.
Effektstärke nach dieser Konzeption ist
zeitbezogenen Maßen in der Physik verwandt, z.B.
der Geschwin-digkeit (Weg/Zeit). Sie beantwortet
die kritische Frage eines Forschers, der wegen
ablehnender Gutachten misstrauischer Kollegen
keine Förderungsmittel erhält und Psi-Forschung
aus der eigenen Tasche bezahlen muss Was kostet
der Psi-Effekt? Effektstärken von zwei Verfahren,
die derzeit allgemein geschätzt werden Die
Y-Achse zeigt unten mit blauen Balken
Effektstärken (ES) von zwei Testverfahren, die
unter strenger Laborkontrolle angewendet
werden. (1) ES des Random Event Generators (REG),
einem sog. Psychokinese-Verfahren, bei dem
Probanden einen physikalisch unmöglich
beeinflussbaren Zufallsprozess mental
synchronisieren, so wie wenn sie einem objektiv
zufällig fallenden Würfel durch bloßes Wünschen
die Tendenz auferlegen würden, bei Stillstand
z.B. eine gerade Zahl häufiger zu zeigen als eine
ungerade. Man sieht, dass REG-Experimentatoren
etwa 130 Mann-Stunden benötigen, um einen Effekt
mit einer Signifikanz von p.05 zu erzielen. Das
ist viel Aufwand, der Effekt ist klein.(2) ES
der Ganzfeld-Telepathie. Eine Person E
(Empfänger) in einer angenehmen und visuell
homogenen Umgebung (im rosaroten Ganzfeld),
eingehüllt von beruhigendem sanftem
Kopfhörer-Rauschen, bereitet sich 15 Minuten lang
darauf vor, dass ihr eine Person S (Sender), die
dann ein zufällig ausgewähltes Bild anschaut,
ihr, der Person E, ihre Bildwahrnehmung mental
übermittelt. Nach der Sendephase hat E aus acht
dargebo-tenen Bildern das von S gesendete Bild
auszuwählen. Auch dieses Verfahren ist aufwendig,
gut 100 Stunden müssen für ein p.05 aufgebracht
werden. Effektstärken beim Pingpong-Balltest (s.
rote Balken) Gruppenleistung unausgelesener
Studierender Aufwand sehr geringMit
durchschnittlich nur 5-10 Stunden bequemer
Hausarbeit bringen Studienanfänger den Psi-Effekt
zur Signifikanz von p .05. Einzelleistung der
psi-talentiertesten Studierenden Aufwand
minimal. Die nach oben anschließenden ES-Balken
besonders psi-talentierter Ballzieher sind so
kurz, dass man nur Striche sieht. In nur 26 bis 2
Minuten überrunden diese Talente den Zufall.
Ihren Treffer-Überhang geben die Prozente an
(100 Überhang doppelt soviel Treffer als
zufallserwartet). Auch J.B. Rhine, der Begründer
der experimentellen Parapsychologie, hatte
anfänglich bei ca. sieben psi-begabten Personen,
die seinen Zener-Karten-Rate-Test absolvierten,
signifikante Ergebnisse nach kurzer Testzeit (die
Graphik zeigt, wo ihre Leistung liegt). Rhines
große Erfolge schwanden, die multiple-choice
Technik kam insgesamt in Misskredit, zu Unrecht,
wie die neue Testvariante des Ballziehens zeigt.
13Wieviel Psi manifestiert sich an unausgelesenen
Stichproben?
Was zeigen Graphik und TabelleDie Senkrechte der
Graphik differenziert die Stichproben, die am
Ballversuch (Einbeutel-Verfahren) teilnahmen (s.
Spalte 1 der Tabelle). Die Waagrechte der Graphik
repräsentiert den Prozentsatz des
Trefferüberhangs (s. Spalte 8 der Tabelle).
Beispiel 18 Treffer in einem Run bedeuten 50
Überhang, da bei 60 Zügen 12 Treffer
zufallserwartet sind. Kommentare zu Stichproben
und ErgebnissenStud 97 waren Teilnehmer des
Versuchsleiters an einer Lehrveranstaltung zur
Anomalistik, deshalb kaum zufällig, was die
Psi-Begabung betrifft. Vier der sieben
Testteilnehmer hatten außergewöhnlich hohe
Trefferquoten. So erklärt sich das Ausscheren von
Stud 97 in der Graphik. Stud 98 bis 2000 waren
Studienanfänger der Psychologie, die durch
Teilnahme eine Bescheinigung über geleistete
Vp-Stunden erreichten. Die indischen Schüler
stammen aus einem Tuition Centre, sie wurden
wahrend ihres Aufenthalts am Centre unter
Aufsicht der Lehrerin getestet. Ein Proband riet
die Zahlen, schüttelte den Beutel und zog die
Bälle, ein Mitschüler schrieb die geratenen und
gezogenen Zahlen
auf. Dass Jungen so viel mehr Treffer hatten als
Mädchen, liegt vielleicht am Motivationsunterschie
d, kann aber auch Zufall sein Der
Trefferüberhang bei einer nicht ausgelesenen
Stichprobe ist oft auf nur circa 10 der
Probanden zurückzuführen. Die Test-Motivation war
sicher stark ausgeprägt bei den Teilnehmern des
parapsychologischen Workshops, die den Balltest
daheim durchführten, doch Psi-Effekte ragen nicht
heraus. Die Bekannten der Diplomandin, die selbst
zu den Begabten der Stud 97 gehörte, führten den
Test ihr zuliebe durch, die meisten waren
Auswärtige und wurden schriftlich
kontaktiert.Empfehlung aus der
ErfahrungGezielte Psi-Hypothesen sollten
möglichst mit Hilfe psi-talentierter Probanden
untersucht werden. Aus unausgelesenen Stichproben
aber lassen sich mit dem Balltest die dafür
notwendigen Talente finden.
1 2 3 4 5 6 7 8 9 10
N (m,w) Runs Runs Hit SD PI Z p per S Avg (ES) Excess
Stud 1997 7 (2,5) 224 32 16.90 6.73 .223 41.2 24.50 10-20
Stud 1998 57 (13,45) 228 4 13.25 3.33 .063 10.4 6.10 10-10
Stud 1999 38 (4,34) 152 4 13.23 4.07 .062 10.25 4.91 10-5
Stud 1900 56 (9,47) 336 6 12.85 3.49 .043 7.04 5.00 10-6
Indian boys 55 (55,0) 165 3 14.67 5.13 .128 22.2 11.10 10-20
Indian girls 51 (0,51) 153 3 12.99 3.63 .050 8.22 3.95 10-5
Workshop participants 16 (4,8) 192 32 12.94 3.89 .048 7.86 4.22 10-5
Students acquaintance 42 (14,17) 168 4 12.58 3.45 .030 4.80 2.42 .008
Z 6.10
Z 4.91
14Wie konstant ist die Psi-Fähigkeit?
Was zeigt die Grafik Die Y-Achse zeigt die
Trefferhäufigkeiten, die das Psi-Talent Katarina
über insgesamt 96 häusliche Runs mit
Ballziehungen (X-Achse) protokolliert hat hat.
Die Mean Chance Expectancy (MCE) für Treffer ist
12 (1/5 bei 60 trials) Die Treffer waren in
allen Runs höher als das MCE. Mit 20 Treffern ist
p.01, mit 24 ( 2 MCE) ist p .00001. Sind
diese Trefferzahlen nicht gemogelt? Als Katarina
später einen Zweibeutelversuch durchführte und
dort ebenfalls sehr hohe Treffersummen
protokollierte, wurde sie gebeten, ihre Runs
unter Aufsicht des Experimentators fortzusetzen.
Die häusliche hohe Trefferzahl erreichte sie dann
auch unter Kontrolle (s. Grafik Sinkt die
Trefferquote bei Katarina...), so dass kein
Grund vorliegt, die hier gezeigten Trefferzahlen
als gemogelt zu verdächtigen. Bedingungsvariation
Bedingung (1) Blockbedingung. Katarina hatte
sich hier die Freiheit genommen, die Zahlen, die
sie bei den einzelnen Zügen ziehen würde, selbst
zu bestimmen statt sie zu raten. Es war ihr
lästig, sich jedes mal eine neue Zahl
auszudenken, die zu ziehen wäre, sie schrieb
stattdessen einen ganzen Block von meist 5
gleichen Zahlen (manchmal 10, oder die ganze
Zeile mit 15 gleichen Zahlen) in die Rate-Zeile
des Protokolls und versuchte, nur diese eine Zahl
dann wiederholt zu ziehen.Bedingung (2)
Standardbedingung. Der Versuchsleiter bat
Katarina, ein normales Rateverhalten zu
praktizieren, d.h.die zu ziehende Zahl vor jedem
Zug neu abzurufen. , Bedingung (3)
Zahlenwiederholung. Hier sollte Katarina bei
jedem Trial möglichst diejenige Zahl nochmals
ziehen, die sie beim vorhergehenden Trial gezogen
hatte. Im Unterschied zur Bedingung 1 musste sie
also die Zielzahl wechseln, wenn sie beim
vorhergehenden Zug keinen Treffer
hatte.Ergebnisse (1) Kein Bias-Verdacht Hat
die Probandin dann, wenn sie gezogene Zahlen
sofort wieder ziehen sollte (in Bedingung 3), mit
Hilfe ihrer Merkfähigkeit mehr Treffer erzielt,
d.h. hat sie sich die Position eines Balls beim
Zurücklegen gemerkt und den Beutel schlecht
geschüttelt? Nein, denn in Bedingung (2), wo die
Zahlen bei jedem Trial wechselten (das
hypothetische Sich-Merken also kaum helfen
konnte), nahmen ihre Treffer nicht ab.(2) Hohe
Varianz der Trefferzahlen Man könnte denken,
dass bei einem Psi-Talent zwar die mittlere
Trefferzahl erhöht ist, dass aber die Varianz der
Treffer der Varianz bei Nicht-Talenten ähnlich
ist. Dem ist nicht so, die Varianz der
Trefferzahlen ist hochgradig überzufällig.
Katarina hatte gute und. deutlich weniger
gute Tage. (3) Erhaltungsneigung Die
Trefferzahlen wechseln nicht zufällig von Sitzung
zu Sitzung, sondern mit einer Erhaltungsneigung.
Die Autokorrelation bei lag1 ist r .54. Es gab
also günstige und weniger günstige
Trefferperioden (über einige Tage). (4)
Veränderungsmuster Die Probandin hatte
tendenziell am Anfang und Ende einer Testserie
mehr Treffer als im mittleren Teil der Serie.
Nicht bei allen Probanden wird ein
Veränderungsmuster im Verlauf einer Serie
beobachtet.
15Simulieren die Probanden beim Raten von Zahlen
echten Zufall?
Was zeigen die Graphiken Die Graphiken A und B
zeigen, welche Zahlen von den Probanden
unmittelbar aufeinander folgend geraten bzw.
gezogen werden. (Fortsetzung der Erklärung weiter
unten). Raten und abrufen eine
Erläuterung.Im Standard- Screening-Test, wo mit
jedem Trial ein Ball mit einer Zahl gezogen wird,
dürfen die Probanden jede beliebige Zahl
ankündigen. Die meisten Probanden stellen sich
die Aufeinanderfolge der zu ziehenden Zahlen als
eine Zufallsreihe vor und versuchen bei jedem
Trial, vorausschauend die jeweils folgende Zahl
zu erraten. Dem liegt eine eher passive
Einstellung zugrunde, d.h. man hofft lediglich zu
erahnen, was ohne eigenes Einwirken beim nächsten
Trial gezogen wird. Nur selten gibt es Probanden,
zumindest erwachsene Kinder verhalten sich da
anders , die die Bälle mit einer ausgeprägt
aktiven Einstellung ziehen, d.h. mit der
Überzeugung, durch bloßes Wünschen eine Zahl in
die Hand zu bekommen und so dem Zufall etwas
Herrschaft streitig machen zu können. Das
aktivere Ankündigen einer Zahl kann man ein
Abrufen nennen, das passivere ein Raten.
Allerdings kommen diese Formen der Ankündigung zu
ziehender Zahlen (calls of targets) wohl selten
in reiner Form vor. Die Verwendung von raten und
abrufen (und des neutraleren ankündigen) ist cum
grano salis zu nehmen. Worauf es nur ankommt ist,
die Faktoren, die den Entscheidungen der
Probanden beim Ankündigen von Zahlen zugrunde
liegen, genauer kennen zu lernen, denn sie
könnten auch für die Frage nach den Bedingungen
des Auftretens von Psi bedeutsam werden. Zur
Graphik AIn den Spalten stehen die Zahlen, die
die Probanden (N151 Studierende) beim letzten
trial geraten hatten. Werden die Entscheidungen
für das Raten beim darauf folgenden Trial (diese
werden durch die Zeilen wiedergegeben) durch das
jeweils vorhergehende Raten (Spalten)
beeinflusst? Wenn nein, dann müssten die Felder
der Matrix leer sein, denn in diesen werden die
Chi2-Abweichungen von der Zufälligkeit des
Zahlen-Ratens wiedergegeben, die positiven
Abweichungen rot , die negativen weiß. Die großen
weißen Kreise in den Diagonalfeldern bedeuten,
dass die Probanden dazu neigen, eine soeben
geratene Zahl nicht sofort wieder zu raten,
sondern die Zahlen zu wechseln. Sie unterschätzen
die Wahrscheinlichkeit, mit der sich Ereignisse
zufällig sofort wiederholen können. Die
Verteilung der roten Kreise lässt erkennen, dass
die Probanden zu kleinen Schritten neigen, d.h.
nach dem Raten einer Zahl raten sie beim nächsten
Trial eine eher benachbarte Zahl. Zur Graphik
BIn den Spalten stehen diesmal die Zahlen, die
beim letzten Trial gezogen wurden, in den Zeilen
aber stehen wieder die anschließend geratenen
Zahlen. Wieder gibt es in den Diagonalfeldern
weiße Kreise, was bedeutet, dass die Probanden
bei ihrem Raten auch eine Wiederholung der gerade
gezogenen Zahlen vermeiden. Der Einfluss der
gerade gezogenen Zahl auf die Rate-Entscheidung
ist jedoch weniger stark als der Einfluss der
gerade geratenen Zahl (A und B haben den gleichen
Maßstab). Auch sind wieder die kleinen Schritte
des Wechsels vorhanden, allerdings
schwächer. Abschlusskommentar1. Die wichtigsten
Faktoren, die dem Zahlenraten zugrunde liegen
(Wechsel der gerade geratenen und der gerade
gezogenen Zahl, aber in kleinen Schritten)
sollten bei der Interpretation von Psi-Effekten
im Pingpong-Test im Auge behalten werden.2. Was
für die Gesamtheit der Studenten gilt, muss
keineswegs für jeden einzelnen unter ihnen
gelten, und es muss auch nicht für jede andere
Population gelten (z.B. gibt es bei Kindern
offenbar entgegengesetzte Tendenzen).
A
L a s t c a l l 1 2 3 4 5
Next cal l
12345
B
L a s t d r a w 1 2 3 4
5
Nextcall
12345
16Haben die Zahlen 1,2,3,4,5 unterschiedliche
Chancen, getroffen zu werden?
Was zeigt die Graphik Die Y-Achse zeigt
Häufigkeiten der geratenen Zahlen, der gezogenen
Zahlen und der Treffer. Die X-Achse differenziert
diese Häufigkeiten zwischen den Zielzahlen 1 bis
5. Wozu diese Häufigkeiten? Vor allem möchte
man wissen, ob es wirklich so ist, wie jeder wohl
zunächst vermutet, dass die Zahlen 1 bis 5 mit
gleicher Wahrscheinlichkeit getroffen werden, es
wird doch wohl keine guten und schlechten Zahlen
geben! Auch sollten die Zahlen von 1 bis 5 mit
ungefähr gleicher Häufigkeit gezogen werden, denn
sie kommen im Beutel gleich häufig vor. Dass die
Zahlen unterschiedlich oft abgerufen werden, ist
schon eher anzunehmen, aber für das Psi-Problem
eigentlich weniger interessant, es sei denn, dass
sich herausstellen sollte, dass Unterschiede in
der Abrufhäufigkeit mit Unterschieden in der
Trefferhäufigkeit zusammenhängen, wenn es denn
solche Unterschiede geben sollte. Woher stammen
die Daten?Sie stammen von N322
Versuchsteilnehmern, aufgeteilt in acht
Stichproben Vier Stichproben Studenten (97,
98, 99, 00), zwei Stichproben indische Schüler
(m, w), eine Stichprobe WGFP-Workshop-Teilnehmer,
eine Stichprobe Bekannte einer Diplomandin. Wie
wurden die Daten verarbeitet?Abrufen und ziehen
Für jede Stichprobe gesondert wurde ermittelt,
wie häufig die Zahlen 1 bis 5 insgesamt abgerufen
und wie häufig sie gezogen wurden. Die
ermittelten Summen wurden prozent-transformiert,
d.h. würde eine Stichprobe exakt gleich oft die
Zahlen 1 bis 5 abrufen, wäre die Häufigkeit für
jede der fünf Zahlen 100, analog wäre 100 die
Häufigkeit der gezogenen Zahlen, wenn sie gleich
der Summe aller Ziehungen geteilt durch 5 wären.
Geringere oder größere Häufigkeiten ergeben Werte
unter bzw. über 100. Da die so ermittelten
Prozentwerte für acht Stichproben vorliegen,
wurde über diese der Mittelwert und die
Standardabweichung errechnet, diese enthält die
Graphik.Treffen Die Originalhäufigkeiten der
Treffer mussten relativiert werden, da die Zahlen
verschieden oft abgerufen wurden, wie die Graphik
zeigt. Wenn jemand z.B. 90 mal die 1 rät und nur
10 mal die 5, hat er bei der 1 viele Treffer und
bei der 5 wenig. Doch ist die Zufallserwartung
der Treffer für jede beliebige Abrufhäufigkeit
20. Bei der anschließenden Prozent-Transformation
sind 100 die Summe der fünf Trefferprozentwerte
dividiert durch 5. ErgebnisseAbrufen Die
Randzahlen 1 und 5 der Zahlenreihe werden weniger
oft aufgerufen als mittlere Zahlen, die 3 und die
2 werden am häufigsten aufgerufen. Vielleicht
haben die Probanden Furcht vor Misserfolg Rufen
sie z.B. eine 3 auf, dann erleben sie eine
daraufhin gezogene 5 als geringeren Fehler, als
wenn sie zuvor z.B. eine 1 aufgerufen
haben.Ziehen Die Zieh-Häufigkeiten weichen von
der Zufallserwartung zwar geringfügig, aber
tendenziell ebenso ab wie die Aufruf-Häufigkeiten.
Dies könnte als Einfluss gedeutet werden
Zahlen, die oft aufgerufen werden, werden oft
gezogen, auch dann, wenn das nicht zu höheren
Trefferzahlen führt. Diese Hypothese müsste
weiter untersucht werden.Treffen Die relativen
Trefferhäufigkeiten sind bei den Randzahlen 5 und
1 erhöht, bei den mittleren Zahlen (vor allem 3
und 2) erniedrigt, den Ratehäufigkeiten
entgegengesetzt.
Das gibt zu denken1. Merkwürdig Je öfter eine
Zahl aufgerufen wird, umso geringer ist bei ihr
der Anteil der Treffer. Handelt es sich hier um
einen kausalen Zusammenhang, oder sind die Zahlen
5 und 1 vom Aufrufverhalten der Probanden
unabhängige Glückszahlen? Andere Erkenntnisse
aus der Literatur unterstützen den Verdacht auf
Verursachung Psi wird durch Routine unterdrückt,
geweckt wird Psi durch eine Abkehr vom
Gewohnten, durch Instabilität Dies gibt Anlass
für gezieltes Experimentieren mit dem Ziel, die
Natur von Psi zu erhellen.2. Der differentielle
Effekt bei den Zielzahlen, was immer ihm zugrunde
liegt, gilt nur für die Probanden als Gesamtheit,
nicht für jeden Teilnehmer individuell, im
Einzelfall könnten Effekte fehlen oder sich
umkehren. Das bleibt zu untersuchen.
17Wie sind die Treffer innerhalb einer Trialserie
verteilt? Gehäuft? Gestreut?
Was zeigt die Graphik Die X-Achse repräsentiert
die Z-Skala. Die Y-Achse gibt an, wie oft die
Z-Werte vorkamen, die mit Hilfe des Runs-Tests
(Siegel, 1967) ermittelt wurden. Der Runs-Test
prüft die Treffer-Dichte. Treffer könnten
stellenweise gehäuft vorkommen dicht wie
Glückssträhnen, gefolgt von Trefferflauten.
Auch könnten die Treffer wenig dicht, d.h.
überzufällig gestreut vorkommen. Psi könnte also
wie ein Nervenpräparat unmittelbar nach einem
Impuls gehemmt werden und kurzzeitig nicht mehr
erregbar sein. Die rote Kurve wurde durch die
Häufigkeitspunkte der beobachteten Daten gelegt,
die blaue Kurve durch die Häufigkeitspunkte von
Kontrolldaten (erläutert unten). Wie
funktioniert der Runs-Test?Man zählt die
ununterbrochenen Folgen von Treffern und die
ununterbrochenen Folgen von Fehlern. Wenn man
z.B. in einer Sitzung von 60 Trials bei den
ersten 30 Ziehungen nur Fehlziehungen (F) hätte,
dann einen Treffer (T), und für den Rest wieder
nur Fehlziehungen (F), dann hätte man 3 Runs (F T
F) (Runs hier also mit speziellerer Bedeutung,
sonst bezeichnet Run eine Serie von 60
Ball-Ziehungen). Mit Zunahme an T werden die Runs
häufiger, sie sind am häufigsten, wenn T so oft
vorkäme wie F und sie würden mit weiterer Zunahme
an T wieder absinken. Die individuell
unterschiedlichen Häufigkeiten von T (60 F)
sind also in der Runs-Formel zu berücksichtigen.
Dennoch ist die Trefferdichte von der
Trefferhäufigkeit unabhängig. Wer viele T hat,
dessen Verteilung der T weicht nicht mehr und
nicht weniger vom Zufall ab (weder in Richtung
gehäuft noch in Richtung gestreut) als die
eines anderen, der wenig T hat. Der Runs-Test
liefert für jeden Probanden einen Z-Wert. Die
Zufallsfrage wurde auf der Ebene der Gesamtheit
mehrerer Stich-proben und für einzelne
Stichproben gesondert durch Chi2 (hier Summe
der individuellen Z2) abgeklärt. Welche Daten
werden zugrundegelegt?Die Daten der Studenten
(vier Stichproben, 98 bis 00 plus 97, N1517)
und der Nicht-Studenten (N160) wurden als
Gesamt-Datensatz und als Einzelstichprobe dem
Runs-Test unterworfen. Kontrolldaten wurden
gewonnen, indem in einem kopierten
Original-Datensatz die Trefferspalte gelöscht und
mit den Zahlen 1 bis 5 neu ausgefüllt wurde, die
die Random-Routine eines Statistik-Programms
lieferte. Damit änderten sich für die künstlichen
Kontrollpersonen auch die Treffersummen, was aber
ohne Auswirkung bleibt. Alternativ wurden für
jeden Probanden die Originaltreffer durch
Randomisierung neu verteilt. Eine so gewonnene
Z-Kurve unterscheidet sich nicht von der nach der
erstgenannten Methode gewonnenen und hier
dargestellten Kurve. ErgebnissePositive Z-Werte
bedeuten Zufallsabweichungen im Sinne geringer
Trefferdichte (isoliertere Folge, Gestreutheit),
negative Z-Werte bedeuten dichtere Folgen von
Treffern (mehr Häufungen).(1) Die mittlere
Trefferdichte der Probanden unterscheidet sich
nicht von der der Kontrollpersonen. (2) Einen
hochsignifikanten Unterschied aber zeigen die
Verteilungen der Trefferdichten. Bei vielen
Probanden ist die Trefferfolge dichter als
zufällig, bei vielen anderen ist sie weniger
dicht (gestreuter) als zufällig, die
Probandenkurve ist gespreizt (Chi2
(df158)223.5, p.00007). Vgl. dagegen das
Ergebnis der Kontrollpersonen Chi2 (
df158)116.5 n.s. (3) Die Trefferdichte hängt,
wie erwartet, mit der Zahl der Treffer nicht
zusammen, die Korrelation zwischen Trefferdichte
und Trefferzahl ist insignifikant, auch wenn man
Trefferdichte auf absolute Z-Werte stützt. Was
folgt daraus?Da Trefferdichte mit der
Trefferzahl nicht korreliert ist, darf ihre
Abweichung vom Zufall als unabhängige
Psi-Variable betrachtet werden, die zum
Gesamt-Psi-Effekt einen eigenen Beitrag liefert.
Der beobachtete maximale Beitrag der
Trefferdichte (Effektgröße PI.24) ist nahezu
halb so groß wie der der Trefferzahl (PI.55).
Die Zufallsabweichungen hinsichtlich
Trefferdichte erhöhen die Validität des Tests.
Zudem haben hier die notorisch Ungläubigen mit
Einwänden gegen Psi wenig Chancen, denn
Trefferdichte können sie in einen
Manipulationsverdacht kaum einbeziehen.
18 Weicht die Aufeinanderfolge gezogener Zahlen
vom Zufall ab?
Was zeigt Graphik A Vorweg eine Erläuterung Die
Zahlen auf den Bällen, die ein Proband von Trial
zu Trial zieht, kann man im Hinblick auf
Aufeinanderfolge überprüfen. Zieht ein Proband
z.B. eine 3, dann hat beim ersten Zug nach dieser
3 (Lag1) jede der fünf Zahlen die gleiche
Chance (20), gezogen zu werden. Beim zweiten Zug
(Lag2 von der zuerst gezogenen 3 aus gerechnet)
hat wiederum jede Zahl die gleiche Zieh-Chance.
Ebenso sollte der dritte, vierte Zug usw. durch
die am Anfang gezogene 3 in keiner Weise
determiniert sein, wenn der pure Zufall regiert.
Graphik A zeigt, wie häufig eine Zahl, die
gezogen wurde, in der ersten, zweiten...bis
vierten Ziehung danach (d.h. für die ersten vier
Lags, s. X-Achse) wieder gezogen wurde, und zwar
als Abweichung von der 20-Erwartung MCE
(Y-Achse). Die Abweichungen sind für Studenten-
und (indische) Schülerprobanden getrennt
dargestellt. Was ging dieser Untersuchung
voraus?Es war aufgefallen, dass die sechs
untersuchten Stichproben erwachsener Probanden
dazu neigten, eine Zahl, die beim Trial ti
gezogen wurde, beim Trial t(i1) nicht gleich
noch einmal zu ziehen eine Art des Meidens von
Zahlwiederholungen, die etwa bis t(i3) andauern
konnte. Interessanterweise zeigten aber die
beiden Schülerstichproben aus Indien (Jungen,
Mädchen) einen entgegengesetzten Trend, die
Schüler neigten zur Wiederholung einer gezogenen
Zahl, nicht zum Wechsel. Deshalb werden in
Graphik A die Abweichungsprozente für Erwachsene
(nur für Studenten, weil homogen als Stichprobe
unter den Erwachsenen) und Schüler getrennt
dargestellt. Der Untersuchung ging ferner die
Beobachtung voraus, dass die Wechselneigung
(Erwachsene) und die Wiederholungsneigung
(Schüler) mit der Ausprägung des Psi-Talents der
Probanden zusammenhängt, ermittelt anhand der
Trefferquoten. Je höher die Trefferquote, umso
stärker die Abweichung, sowohl für Studenten als
auch Schüler. Deshalb werden in Graphik A die
Ergebnisse für trefferstarke und trefferschwache
Probanden getrennt dargestellt, mit den
Selektionskriterien für die Studenten gt14 Treffer
(N50) und lt11 Treffer (N50), für die Schüler
gt15 Treffer (N23) und lt12 Treffer
(N23). Ergebnis Graphik ADie trefferschwachen
Probanden (Schüler und Studenten) verhalten sich
hinsichtlich der Abfolge gezogener Zahlen, wie
der Zufall es erwarten lässt (s. gestrichelte
waagrechte Linien nahe der MCE). Nur die
trefferstarken Probanden zeigen eine ausgeprägte
Wiederholungsneigung (Studenten) bzw.
Wechselneigung (Schüler), die von Lag 1 bis Lag 4
abnimmt (Z-Werte nur für Lag 1 angegeben). Was
zeigt Graphik B?Sie zeigt Abweichungen in der
Abfolge der von den Probanden geratenen Zahlen
(Calls), die den Ball-Ziehungen vorausgehen. Es
lag nahe zu vermuten, dass die beobachteten
Unterschiede zwischen Studenten und Schülern beim
Ziehen der Zahlen mit ihrer unterschiedlichen
Neigung zum Wechsel bzw. zur Wiederholung beim
Abruf der Zahlen zusammenhängen.Tatsächlich
zeigen die Studenten eine ausgeprägte Neigung zum
Call-Wechsel, während die Schüler eine ebenso
ausgeprägte Neigung zur Call-Wiederholung
zeigen.In beiden Stichproben nimmt von Lag 1 bis
Lag 4 die Neigung zur Call-Wiederholung zu, doch
bei den Schülern auf einem insgesamt höheren
Wiederholungsniveau, bei den Studenten auf einem
niedrigen Wiederholungsniveau. Für die Deutung
ist wichtig, dass sich Probanden mit viel und
wenig Treffern im Call-Verhalten nicht
unterscheiden. Fazit Unterschiedliche Tendenzen
zur Call-Wiederholung bzw. zum Call-Wechsel
schlagen sich in analogen Abfolgestrukturen
gezogener Zahlen nieder - ein versteckter,
deshalb unverdächtiger, mit dem Trefferüberhang
korrelierter Psi-Indikator.
A
Lag of number repetition
B
19Wenn Psi keine Treffer begünstigt, dann verhilft
es oft zu guten Fehlern
Was zeigt die Graphik Die Graphik zeigt bei vier
Probanden (X-Achse) das Vorkommen guter
Fehler. Man kann sie auch Fast-Treffer nennen.
Denn wenn man eine 5 ziehen will und zieht die 4,
oder wenn man eine 1 ziehen will, und zieht die
2, dann hat man die Zielzahl fast getroffen. Die
Häufigkeit solch guter Fehler sollte eigentlich
ebenso zufällig sein wie die der anderen Fehler
und wie die der Treffer. Sie sind es nicht, wie
die Abweichungen der Proportionen von der Linie
der Erwartung zeigen. (Erwartet werden 0.20, d.h.
ein Fünftel bei fünf Zahlen, s. Y-Achse). Und die
Unterschiede? Die Unterschiede zwischen den vier
Personen sind hier weniger wichtig als die
intra-individuellen Unterschiede zwischen den
drei Bedingungen (s. Ziffern an den
Säulen-füßen). Zunächst ist auffällig (man
beachte die roten Säulen), dass unter der
Standard-bedingung, wo beliebig Zahlen zwischen 1
und 5 abgerufen werden, die guten Fehler nur
sehr geringfügig häufiger sind als vom Zufall zu
erwarten (Diese Tendenz unter der
Standardbedingung wurde erst bei dem großem N der
Gesamtstichprobe signifikant). Sonderbedingung
bei Kannan Möglichst hohe oder niedrige Zahlen
ziehen Kannan sollte unter seiner Sonderbedingung
möglichst hohe Zahlen abrufen und treffen. So war
die 5 die erste Wahl für sein Abrufen, doch wenn
er sie nicht traf, war eine 4 willkommener als
eine 3, die 1 wäre dann am wenigsten willkommen.
Doch sollte Kannan die abgerufenen Zahlen auch
möglichst treffen. Wenn die 4 abgerufen wurde,
war es besser, eine 4 statt einer 5 zu ziehen.
In einer Abwandlung der Bedingung war Kannan
gehalten möglichst niedrige Zahlen zu ziehen.
Kannan erzielte bei diesen Versuchen nicht nur
sehr viele Treffer (nicht gezeigt hier), sondern
auch sehr viele gute Fehler (siehe Graphik).
Psi kann also zweigleisig fahren wenn dem
Primärwunsch (Volltreffer) nicht entsprochen
wird, dann wird dem Sekundärwunsch (Fasttreffer)
entsprochen. Sonderbedingung bei Katarina
Gezogene Zahl nochmals ziehen Katarinas Tendenz
zu guten Fehlern kann nicht auf einen
Sekundärwunsch zurückgeführt werden. Sie sollte
versuchen, immer diejenige Zahl nochmals zu
ziehen, die sie gerade gezogen hatte. Zog sie
z.B. eine 5, dann sollte sie die 5 nochmals
ziehen, zog sie dann aber eine 1, dann sollte sie
die 1 zu ziehen versuchen usw. Unter dieser
Bedingung ist die gute-Fehler-Tendenz sehr
ausgeprägt. Warum? Das ist nicht leicht zu
verstehen. Ein guter Fehler bringt unter dieser
Sonderbedingung eigentlich genauso wenig Gewinn
für die Probandin wie unter der
Standardbedingung. Sonderbedingung bei Barbara
und Oliver Partnervorhersage Das Ergebnis von
Barbara und Oliver ist etwas verständlicher Denn
wenn die beiden Partner zusammen Bälle zogen -
der eine sagte Zahlen voraus, der andere zog die
Bälle-, dann war die Trefferhäufigkeit bei beiden
hochsignifikant schlecht (psi-missing), und
zwar nur unter dieser Kooperationsbedingung. Die
vielen guten Fehler (s. Graphik) könnte man als
Ausdruck einer latenten Wunscherfüllung deuten.
20Gute Fehler im Detail
Was zeigen die Graphiken Die erste Graphik
(Target 1) zeigt, wie weit die
Psychologie-Studierenden (N151), wenn sie die 1
ziehen wollten, mit der dann tatsächlich
gezogenen Zahl von 1 entfernt waren. Die Distanz
war 0, wenn sie die 1 getroffen hatten (s.
X-Achse). Zogen sie die 2, dann waren sie 1 vom
Ziel entfernt, usw., zogen sie 5, waren sie 4
vom Ziel entfernt. Die Y-Achse zeigt
Häufigkeiten des Auftretens der Distanzen
(prozentual), mit Standardabweichungen als
Fehlerbalken. Wie wurden die Prozentwerte
ermittelt? Die Summe der vier für jedes Target
spezifischen Nichttreffer wurde gebildet und
durch 4 dividiert. Das ergab den Erwartungswert
für die Nichttreffer, der dann den 100
Bezugswert definierte. Alle Häufigkeiten, auch
die der Treffer (Distanz 0) wurden auf den
100-Wert bezogen. Die Prozent-Umrechnung bringt
die Unterschiede in der Rate-Bevorzugung bei den
Zahlen 1 bis 5 zum Verschwinden. Beim Target 2
kommen die Distanzen 1 und -1 vor, wenn nämlich
die 2 verfehlt und die 3 bzw. die 1 gezogen wird.
Zieht man die 5 bei Target 2, dann ist die
Distanz maximal (hier 3). Wenn Plus- und
Minus-Differenzen vorkommen (das ist bei Target
2, 3, und 4 der Fall), dann werden auf der
X-Skala die Plus-Differenzen vor den
Minus-Differenzen abgetragen (die Entscheidung
ist willkürlich, aber für den voliegenden Fall
unbedeutend). Ergebnis Der große Anteil an
Ziehungen mit Distanz 0 (das sind Treffer) ist
am auffälligsten. Aber darum geht es hier
weniger. Interessanter ist die darüber hinaus
erkennbare Neigung