← Experimente

P1-Bericht erklärt — Von Rotationskurven zur schwachen Linsenwirkung: Wie sich die mittlere Gravitationsantwort der EFT prüfen lässt

Ein allgemein verständlicher Leitfaden auf Grundlage von P1_RC_GGL: Ein strenger Closure-Test von Galaxiendynamik und schwacher Linsenwirkung (v1.1)

Originalbericht von Guanglin Tu | Versionsgrundlage: P1 v1.1 | Einordnung: öffentliche Erklärung / kein peer-reviewter Fachaufsatz
Zugehörige Archive: Bericht-DOI 10.5281/zenodo.18526334 | Reproduktionspaket-DOI 10.5281/zenodo.18526286

Lesehinweis

Dies ist eine erklärende Fassung, kein eigenständiger wissenschaftlicher Bericht. Sie basiert auf dem ursprünglichen P1-Bericht, bewahrt die wichtigsten Abbildungen und Tabellen und ergänzt zu jedem Hauptschritt allgemein verständliche Erläuterungen.

Dieser Leitfaden erläutert nur, was P1 unter seinen festgelegten Datensätzen, seinem Parameterbuch und seinem statistischen Protokoll schlussfolgert: Im gemeinsamen Test von Galaxien-Rotationskurven (RC) und Galaxie-Galaxie-Schwachlinsenwirkung (GGL) schneidet das Modell der mittleren Gravitationsantwort der EFT deutlich besser ab als die hier getestete minimale DM_RAZOR-Basislinie.

Dieser Leitfaden interpretiert P1 nicht als Behauptung, „Dunkle Materie sei widerlegt“. P1 ist nur der erste Schritt der P-Serien-Experimente. Er testet eine beobachtbare Ebene der EFT – den „mittleren Gravitationssockel“ – nicht den vollständigen Inhalt des gesamten EFT-Rahmens.

0 | P1 in fünf Minuten verstehen: Worum geht es in diesem Test?

Man kann P1 als einen Konsistenztest über verschiedene Sonden hinweg verstehen. Es geht nicht nur darum, ob ein Modell einen einzelnen Datensatz anpassen kann. Stattdessen werden zwei sehr unterschiedliche Gravitationsanzeigen auf denselben Prüfstand gelegt: Rotationskurven (RC) lesen die Dynamik in Galaxienscheiben, während die Galaxie-Galaxie-Schwachlinsenwirkung (GGL) die projizierte Gravitationsantwort auf größeren Skalen liest.

P1 in einem Satz

P1 hebt die Messlatte von „passt es eine Sonde gut an?“ zu „schließt es über Sonden hinweg?“ Ein Modell hat eine von RC und GGL geteilte Gravitationsstruktur eher erfasst, wenn es unter der korrekten Abbildung gut abschneidet und das Signal nach dem Mischen der Abbildung zusammenbricht.

Tabelle 0 | Die Kernzahlen von P1 und wie man sie liest

Metrik

Lesart in P1 / P1A

Bedeutung in einfacher Sprache

Gemeinsamer Fit ΔlogL_total

Im Haupttext-Vergleich liegt EFT um 1155–1337 über DM_RAZOR

Die Gesamtpunktzahldifferenz über beide Datensätze hinweg; größer bedeutet eine bessere Gesamterklärung.

Closure-Stärke ΔlogL_closure

Im Haupttext-Vergleich liegt EFT bei 172–281, DM_RAZOR bei 127

Die Fähigkeit, GGL nach Inferenz allein aus RC vorherzusagen; größer bedeutet stärkere Selbstkonsistenz über Sonden hinweg.

Shuffle-Negativkontrolle

Nach dem Mischen von RC-bin→GGL-bin fällt das EFT-Closure-Signal auf 6–23

Wenn die korrekte Zuordnung zerstört wird, sollte der Vorteil verschwinden; je schärfer der Zusammenbruch, desto besser lässt sich ein Scheinsignal ausschließen.

P1A-Stresstest mit mehreren DM-Zweigen

DM 7+1 + DM_STD, mit EFT_BIN als Vergleich

P1A betrachtet nicht nur die minimale DM_RAZOR-Basislinie. Es bringt mehrere niedrigdimensionale, prüffähige DM-Erweiterungszweige in dasselbe Closure-Protokoll.


1 | Warum P1? Wo steckt die Kosmologie auf Galaxienskalen fest?

Probleme auf Galaxienskalen bleiben schwierig, weil der Bedarf an „zusätzlicher Gravitation/Masse“ nicht nur ein Phänomen der Rotationskurven ist. Viele Beobachtungen zeigen eine enge Verbindung zwischen der sichtbaren baryonischen Materie in Galaxien und den tatsächlichen dynamischen beziehungsweise Linsen-Messwerten. Für den Dunkle-Materie-Ansatz bedeutet das, dass dunkle Halos, baryonisches Feedback, die Geschichte der Galaxienentstehung und Beobachtungssystematiken sehr präzise aufeinander abgestimmt werden müssen. Für Gravitationsansätze ohne Dunkle Materie bedeutet es: Ein Modell darf nicht nur bei RC gut aussehen; es muss auch schwache Linsenwirkung, Populations-Skalierungsrelationen und Negativkontrollen bestehen.

Genau darin liegt die Motivation von P1. Der Test beginnt nicht mit „Dunkle Materie ist falsch“ oder „EFT muss stimmen“. Er stellt eine prüfbare Behauptung auf den Prüfstand: Kann die mittlere Gravitationsantwort der EFT im RC→GGL-Closure-Test über verschiedene Sonden hinweg ein reproduzierbares und übertragbares Signal hinterlassen?

Externer Literaturkontext: Warum das RC+GGL-Fenster wichtig ist

Die von McGaugh, Lelli und Schombert 2016 vorgeschlagene radiale Beschleunigungsrelation (RAR) zeigt eine enge Korrelation mit geringer Streuung zwischen der durch Rotationskurven gemessenen beobachteten Beschleunigung und der aus baryonischer Materie vorhergesagten Beschleunigung. Damit wird eine Kopplung zwischen Baryonen und Gravitationsantwort für Theorien auf Galaxienskalen unvermeidlich.

Brouwer et al. (2021) nutzten KiDS-1000-Schwachlinsenwirkung, um die RAR auf niedrigere Beschleunigungen und größere Radien auszudehnen, und verglichen MOND, Verlindes emergente Gravitation und LambdaCDM-Modelle. Sie wiesen außerdem darauf hin, dass Unterschiede zwischen frühen und späten Galaxientypen, Gashalos und die Galaxie-Halo-Verbindung zentrale Erklärungsprobleme bleiben.

Mistele et al. (2024) nutzten schwache Linsenwirkung weiter, um Kreisgeschwindigkeitskurven isolierter Galaxien abzuleiten, und berichteten bis zu mehreren hundert kpc und sogar bis etwa 1 Mpc keinen klaren Abfall, im Einklang mit der BTFR. Das zeigt, dass schwache Linsenwirkung zu einem wichtigen externen Messfenster für die Prüfung der Gravitationsantwort auf Galaxienskalen wird.

Der Wert von P1 besteht daher nicht darin, „als Erster RC und GGL gemeinsam zu diskutieren“. Der Wert liegt darin, beide in ein prüffähiges Protokoll einzubetten: feste Abbildung, Parameterbuch, RC-only→GGL-Closure, Shuffle-Negativkontrollen und P1A-Stresstests mit mehreren DM-Varianten.


2 | Was bedeutet EFT in P1? Es ist nicht Effective Field Theory

Hier bezeichnet EFT die Energie-Filament-Theorie (Energy Filament Theory, EFT), nicht die in der Physik übliche Effective Field Theory. Im technischen P1-Bericht wird EFT bewusst zurückhaltend verwendet: Sie tritt nicht als vollständige Endtheorie in den Vergleich ein, sondern zunächst als beobachtbare, anpassbare und falsifizierbare Parametrisierung einer „mittleren Gravitationsantwort“.

Einfach gesagt: P1 diskutiert nicht zuerst jede mikroskopische Quelle zusätzlicher Gravitation und versucht auch nicht, den gesamten EFT-Rahmen auf einmal zu beweisen. Der Test stellt eine engere und härtere Frage: Falls es auf Galaxienskalen eine mittlere zusätzliche Gravitationsantwort gibt, kann sie zunächst RC erklären und anschließend auf GGL übertragen werden?

Welchen Teil der EFT testet P1?

P1 zielt auf den „mittleren Gravitationssockel“: einen statistisch stabilen Mittelbeitrag, der über Stichproben hinweg übertragbar ist.

P1 behandelt noch nicht den „stochastischen/Rausch-Sockel“: Zufallsterme, individuelle Unterschiede oder zusätzliche Streuung, die feinere mikroskopische Fluktuationsprozesse einführen könnten.

P1 behandelt auch nicht den vollständigen mikroskopischen Mechanismus, Häufigkeit, Lebensdauer oder globale kosmologische Nebenbedingungen. Es ist der erste Schritt der P-Serien-Experimente, kein endgültiges Urteil.


3 | Der P1-Serienplan: Warum mit dem „mittleren Sockel“ beginnen?

Die P-Serie lässt sich als Beobachtungs-Retrieval-Programm der EFT verstehen. Sie breitet nicht alle Behauptungen auf einmal aus, sondern isoliert den Teil, der sich mit öffentlichen Daten am leichtesten testen lässt. Die Strategie von P1 besteht darin, zuerst den Mittelwert-Term zu prüfen: Wenn die mittlere Gravitationsantwort nicht einmal von RC nach GGL schließen kann, fehlt eine tragfähige Eintrittsstelle für komplexere Rauschterme oder mikroskopische Mechanismen.

Tabelle 1 | Geschichtete Einordnung der P-Serie

Ebene

Gestellte Frage

Rolle in P1

P1

Kann die mittlere Gravitationsantwort in RC→GGL schließen?

Hauptfrage des vorliegenden Berichts

P1A

Bleibt die Schlussfolgerung stabil, wenn die DM-Seite verstärkt wird?

Anhang B: DM 7+1 + DM_STD-Stresstest

Spätere P-Serien-Arbeiten

Lässt sich das Protokoll auf mehr Daten, mehr Sonden und komplexere Systematiken ausdehnen?

Richtung für künftige Arbeit

Tieferliegende Fragen

Wie hängen Mittelwert-Term, Rauschterme und mikroskopischer Mechanismus zusammen?

Außerhalb des Schlussfolgerungsbereichs von P1


4 | Welche Daten werden verwendet? Was sagen RC und GGL jeweils aus?


4.1 Rotationskurven (RC): Der „Geschwindigkeitsmesser“ in Galaxienscheiben

Rotationskurven erfassen, wie schnell Gas und Sterne in verschiedenen Radien um das Zentrum einer Galaxie kreisen. Je schneller die Rotation, desto stärker muss die notwendige Zentripetalkraft in diesem Radius sein – und damit desto stärker die effektive Gravitation. P1 verwendet die SPARC-Datenbank; nach Vorverarbeitung gehen 104 Galaxien und 2.295 Geschwindigkeitsdatenpunkte ein, aufgeteilt in 20 RC-bins.


4.2 Schwache Linsenwirkung (GGL): Eine großskalige „Gravitationswaage“

Galaxie-Galaxie-Schwachlinsenwirkung misst, wie Vordergrundgalaxien das Licht von Hintergrundgalaxien leicht krümmen. Sie entspricht einer projizierten Gravitationsantwort auf größeren, haloartigen Radien und hängt nicht von Details der Gasdynamik innerhalb einer Galaxie ab. P1 verwendet die öffentlichen GGL-Daten aus KiDS-1000 / Brouwer et al. (2021): 4 Sternmassen-bins, 15 radiale Punkte pro bin, insgesamt 60 Datenpunkte, unter Verwendung der vollständigen Kovarianz.


4.3 Feste Abbildung: Warum 20 RC-bins → 4 GGL-bins wichtig sind

P1 verbindet die 20 RC-bins über eine feste Regel mit den 4 GGL-bins: Jeder GGL-bin entspricht 5 RC-bins, die nach Galaxienzahl gewichtet gemittelt werden. Diese Abbildung bleibt für alle Modelle unverändert und wirkt als harte Nebenbedingung für Closure-Test und fairen Vergleich.

Warum die Abbildung nicht nachträglich einstellen?

Wenn man nachträglich wählen könnte, „welche RC-bins welchen GGL-bins entsprechen“, könnte ein Modell Closure durch Umordnen der Zuordnung herstellen. P1 sperrt die 20→4-Abbildung im Voraus und zerstört sie absichtlich mit einer Shuffle-Negativkontrolle, genau um zu beurteilen, ob das Closure-Signal wirklich von einer physikalisch plausiblen Zuordnung abhängt.


5 | Modelle und Methoden: Was vergleicht P1 genau?


5.1 Die EFT-Seite: Niedrigdimensionale mittlere Gravitationsantwort

Auf der EFT-Seite beschreibt ein niedrigdimensionaler Zusatzgeschwindigkeits-Term die mittlere Gravitationsantwort. Die Form des Zusatzterms wird durch eine dimensionslose Kernfunktion f(r/ℓ) kontrolliert; ℓ ist die globale Skala, und die Amplitude wird je RC-bin vergeben. Verschiedene Kerne stehen für unterschiedliche Anfangssteigungen, Übergangsgeschwindigkeiten und langreichweitige Ausläufer und dienen als Robustheits-Stresstests.


5.2 Die DM-Seite: Haupttext-Vergleich und Anhang P1A müssen getrennt gelesen werden

Im Haupttext-Vergleich ist DM_RAZOR eine minimierte, prüffähige NFW-Basislinie: Sie verwendet eine feste c–M-Beziehung und enthält keine Halo-zu-Halo-Streuung, keine adiabatische Kontraktion, keine Feedback-Kerne, keine Nicht-Sphärizität und keine Umwelterme. Die Stärke dieses Designs liegt in kontrollierten Freiheitsgraden und einfacher Reproduzierbarkeit; seine Schwäche liegt darin, dass es nicht jedes LambdaCDM- oder Dunkle-Materie-Halo-Modell repräsentieren kann.

In Anhang B (P1A) wird die DM-Seite deshalb in eine Reihe „standardisierter Stresstests“ überführt. Ohne die gemeinsame Abbildung oder das Closure-Protokoll zu ändern, fügt P1A schrittweise niedrigdimensionale Erweiterungszweige hinzu, etwa SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m und die kombinierte Basislinie DM_STD; EFT_BIN bleibt als Vergleich erhalten. Kurz gesagt: P1A vergleicht nicht nur gegen eine einzige minimale DM-Basislinie, sondern misst mehrere gängige, prüffähige DM-Mechanismen mit demselben „Closure-Lineal“.

Die hier verwendete präzise Schlussfolgerungsformulierung

Haupttext: Die EFT-Familie schneidet im Hauptvergleich deutlich besser ab als die minimale DM_RAZOR.

Anhang B / P1A: Unter mehreren niedrigdimensionalen, prüffähigen DM-Erweiterungszweigen und dem DM_STD-Stresstest verbessern sich einige gemeinsame DM-Fits, aber die Closure-Stärke beseitigt den Vorteil von EFT_BIN nicht.

Die vorsichtigste Aussage lautet daher: Innerhalb der Daten, Abbildung, des Parameterbuchs und des Closure-Protokolls von P1/P1A zeigt die mittlere Gravitationsantwort der EFT stärkere Konsistenz über Datensätze hinweg; das ist nicht gleichbedeutend mit dem Ausschluss aller Dunkle-Materie-Modelle.


5.3 Closure-Test: Die wichtigste experimentelle Grammatik von P1

1. Nur RC wird angepasst, um eine Menge RC-only-Posterior-Samples zu erhalten.

2. Mit GGL wird nicht nachjustiert; der RC-Posterior wird direkt zur Vorhersage von GGL verwendet.

3. Mit der vollständigen Kovarianz wird der GGL-Vorhersagewert unter der korrekten Abbildung berechnet: logL_true.

4. Die Zuordnung RC-bin→GGL-bin wird zufällig permutiert, um den Negativkontrollwert logL_perm zu berechnen.

5. Die Differenz ergibt die Closure-Stärke: ΔlogL_closure = <logL_true> − <logL_perm>.

Anschauliche Analogie

Ein Closure-Test ist wie eine Wiederholungsprüfung in einem anderen Prüfungsraum. Das Modell lernt zuerst Muster im RC-Raum und antwortet dann im GGL-Raum. Wenn es eine gemeinsame Regel und keinen lokalen Trick gelernt hat, sollte es nach dem Raumwechsel weiterhin gut antworten; wenn die Zuordnung zwischen den Prüfungsräumen absichtlich gemischt wird, sollte der Vorteil verschwinden.


5.4 Vor den technischen Tabellen: Vier Einstiegspunkte

Tabelle 5.4 | Lesepfad für die nächste Gruppe technischer Tabellen im Querformat

Einstiegspunkt

Worauf achten?

Warum es wichtig ist

Tabelle S1a

Gesamtpunktzahl des gemeinsamen RC+GGL-Fits

Beantwortet: „Wenn beide Datensätze gemeinsam betrachtet werden, wessen Gesamterklärung ist stärker?“

Tabelle S1b

Closure-Stärke, Shuffle und Robustheitsscans

Beantwortet: „Kann das aus RC Gelernte auf GGL übertragen werden?“

Tabelle B0

Definitionen mehrerer DM-Erweiterungszweige in P1A

Verhindert, dass P1 auf „nur einen Vergleich mit minimaler DM_RAZOR“ reduziert wird.

Tabelle B1

P1A-Scoreboard für Closure und gemeinsamen Fit

Prüft, ob der Closure-Vorteil nach Verstärkung von DM verschwindet.

Layouthinweis

Ab der nächsten Seite beginnen Querformatseiten, damit die breiten Tabellen aus dem Originalbericht vollständig erhalten bleiben, ohne Spalten zu löschen oder bis zur Unlesbarkeit zu komprimieren. Der Fließtext hat bereits eine allgemein verständliche Lesart gegeben; die technischen Tabellen im Querformat sind für Leser gedacht, die Werte und Modellzweige prüfen möchten.

Abbildung 0.1 | Der Closure-Test-Workflow von P1 in einem Diagramm

Hinweis: Die obere Kette ist der „Closure-Test“ (nur RC anpassen → den RC-Posterior zur Vorhersage von GGL verwenden); die untere Kette ist der „gemeinsame Fit“ (RC+GGL zusammen bewerten). Rechts wird die echte Abbildung mit der gemischten Abbildung verglichen, um die Closure-Stärke ΔlogL zu erhalten.


6 | Zentrale technische Tabellen: Haupttabellen aus dem Originalbericht und P1A-Tabellen

Tabelle S1a | Hauptkennzahlen des gemeinsamen Fits (RC+GGL, Strict; aus dem Originalbericht übernommen)

Modell (Workspace)

W-Kern

k

Gemeinsamer logL_total (bester)

ΔlogL_total ggü. DM

AICc

BIC

DM_RAZOR

keiner

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

keiner

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponentiell

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelle S1b | Closure- und Robustheitskennzahlen (Strict; aus dem Originalbericht übernommen)

Modell (Workspace)

Closure ΔlogL (true-perm)

ΔlogL nach Shuffle-Negativkontrolle

σ_int-Scan ΔlogL-Bereich

R_min-Scan ΔlogL-Bereich

cov-shrink-Scan ΔlogL-Bereich

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Tabelle B0 | Definitionen der DM-Erweiterungszweige in P1A (aus Anhang B des Originalberichts übernommen)

Workspace

dm_model

Neuer Parameter (≤1)

Physikalische Motivation (Kern)

Implementationsprinzip (prüffreundlich)

DM_RAZOR

NFW (feste c–M-Beziehung, keine Streuung)

Minimale, prüffähige LambdaCDM-Halo-Basislinie; dient als strenger Vergleich mit EFT

Feste gemeinsame Abbildung; striktes Parameterbuch; nur als relative Vergleichsbasis verwendet

DM_RAZOR_SCAT

NFW + c–M-Streuung (Legacy)

σ_logc

Die c–M-Beziehung besitzt Streuung; angenähert durch eine einparametrige lognormale Streuung

≤1 neuer Parameter; nutzt weiterhin die gemeinsame Abbildung; Closure-Gewinn ist das Akzeptanzkriterium

DM_RAZOR_AC

NFW + adiabatische Kontraktion (Legacy)

α_AC

Baryonischer Einfall kann eine adiabatische Halo-Kontraktion verursachen; angenähert durch eine einparametrige Stärke

≤1 neuer Parameter; Abbildung unverändert; berichtet Änderungen von AICc/BIC und Closure-Gewinn

DM_RAZOR_FB

NFW + Feedback-Kern (Legacy)

log r_core

Feedback kann einen inneren Kern erzeugen; angenähert durch eine einparametrige Kernskala

≤1 neuer Parameter; gleicher Closure-/Negativkontrollrahmen; RC-only-Verbesserung ist nicht das alleinige Ziel

DM_HIER_CMSCAT

Hierarchische c–M-Streuung + Prior

σ_logc (hier)

Ein standardnäheres hierarchisches c_i∼logN(c(M_i),σ_logc); beeinflusst den gemeinsamen RC- und GGL-Posterior

Expliziter Prior; latente c_i marginalisiert; bleibt niedrigdimensional und prüffähig

DM_CORE1P

Ein-Parameter-Kernproxy (von coreNFW/DC14 inspiriert)

log r_core

Nutzt einen einparametrigen Kernproxy für den Haupteffekt baryonischen Feedbacks und vermeidet hochdimensionale Details der Sternentstehung

Zitiert Standardliteratur; ≤1 neuer Parameter; an den Closure-Test gebunden

DM_RAZOR_M

NFW + Störparameter für Linsenscher-Kalibrierung

m_shear (GGL)

Absorbiert eine zentrale Systematik auf der Schwachlinsenseite mit einem effektiven Parameter und verringert das Risiko, Systematik als Physik zu behandeln

Störparameter explizit verzeichnet; darf nicht auf RC zurückwirken; Ergebnisse werden primär nach Closure-Robustheit beurteilt

DM_STD

Standardisierte DM-Basislinie (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Bringt die drei häufigsten Einwände in eine weiterhin niedrigdimensionale standardisierte Basislinie

Berichtet Parameterbuch und Informationskriterien gemeinsam; Closure ist die Hauptmetrik; stärkster DM-Verteidigungsvergleich

Tabelle B1 | P1A-Scoreboard (größer ist besser; aus Anhang B des Originalberichts übernommen)

Modellzweig (Workspace)

Δk

Bester RC-only logL_RC (Δ)

Closure-Stärke ΔlogL_closure (Δ)

Bester gemeinsamer logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Wie Tabelle B1 zu lesen ist (P1A-Scoreboard)

• Δk: neu hinzugefügte Freiheitsgrade (größer bedeutet ein komplexeres Modell; komplexer heißt nicht automatisch besser).

• Achten Sie auf zwei Spalten: Closure-Stärke ΔlogL_closure(Δ) (größer bedeutet stärkere Transfer-Selbstkonsistenz) und bester gemeinsamer logL_total(Δ) (Gesamtpunktzahl des gemeinsamen Fits).

• Der Wert in Klammern, (Δ), ist die Differenz relativ zu DM_RAZOR und erleichtert den direkten Vergleich.

• Die Hauptfrage dieser Tabelle lautet, ob der Closure-Vorteil verschwindet, wenn die DM-Basislinie „vernünftig verstärkt“ wird.

• Lesetipp: DM_STD verbessert die gemeinsame Punktzahl deutlich, aber seine Closure-Stärke fällt; EFT_BIN bleibt in der Closure-Stärke weiterhin höher.

In einem Satz: Innerhalb dieser niedrigdimensionalen, prüffähigen Menge von DM-Erweiterungen erzeugt ein besserer gemeinsamer Fit nicht automatisch stärkere Closure; Closure, also Übertragbarkeit, bleibt das zentrale Kriterium.


7 | Wie sind die Hauptergebnisse zu lesen?

7.1 Gemeinsamer Fit: Über beide Datensätze hinweg ist der EFT-Hauptvergleich höher bewertet

Tabelle S1a und Abbildung S4 zeigen: Unter denselben Daten, derselben gemeinsamen Abbildung und annähernd derselben Parametergröße erreicht die EFT-Familie gegenüber DM_RAZOR ein gemeinsames ΔlogL_total von 1155–1337. Allgemein verständlich heißt das: Unter derselben Bewertungsregel für RC und GGL zusammen erhalten die EFT-Hauptvergleichsmodelle eine höhere Gesamtpunktzahl.


7.2 Closure-Test: Was P1 vor allem betont, ist „Übertragbarkeit“

Eine hohe Closure-Stärke bedeutet, dass aus RC allein abgeleitete Parameter GGL besser vorhersagen können, ohne GGL noch einmal zur Anpassung zu verwenden. Im P1-Bericht liegt ΔlogL_closure der EFT bei 172–281, während DM_RAZOR bei 127 liegt. Dieses Ergebnis ist wichtiger als die Aussage, dass „jedes Modell seine eigenen Daten gut anpasst“, weil es die Freiheit des Modells im zweiten Datensatz einschränkt.


7.3 Negativkontrolle: Warum ist ein „Signalkollaps“ ein gutes Zeichen?

Nachdem P1 die Gruppenzuordnung RC-bin→GGL-bin zufällig gemischt hat, fällt das EFT-Closure-Signal auf den Bereich 6–23. Für allgemeine Leser ist dieser Schritt eine Art Anti-Schummelprüfung: Wenn der Closure-Vorteil nur durch Code, Einheiten, Kovarianzbehandlung oder Zufall beim Fitten entstünde, könnte der Vorteil auch unter gemischter Zuordnung bestehen bleiben. Tatsächlich bricht er jedoch zusammen; das zeigt, dass er von der korrekten Abbildung abhängt.

Abbildung S3 | Closure-Stärke (größer ist besser): mittlerer Log-Likelihood-Vorteil für RC-only → GGL-Vorhersage.

Wie diese Abbildung zu lesen ist

Diese Abbildung ist der Kern von P1. Je höher der Balken, desto besser wird die aus RC gelernte Information auf GGL übertragen.

Die EFT-Familie liegt insgesamt über DM_RAZOR; das weist im Experiment „erst RC lernen, dann GGL vorhersagen“ auf stärkere EFT-Closure über Sonden hinweg hin.

Abbildung S4 | Vorteil im gemeinsamen Fit (größer ist besser): bester logL_total von RC+GGL relativ zu DM_RAZOR.

Wie diese Abbildung zu lesen ist

Diese Abbildung zeigt die Gesamtpunktzahl, nachdem RC und GGL kombiniert wurden.

Alle EFT-Modelle liegen deutlich über 0; das zeigt, dass der EFT-Vorteil im Hauptvergleich kein lokaler Einzelpunkteffekt ist, sondern ein Gesamtmuster der gemeinsamen Analyse.

Abbildung R1 | Negativkontrolle: Das Closure-Signal fällt nach dem Mischen der Gruppierung stark ab.

Wie diese Abbildung zu lesen ist

Diese Abbildung zeigt: Sobald die korrekte RC↔GGL-bin-Beziehung gestört wird, fällt das Closure-Signal stark ab.

Dadurch wirkt das P1-Ergebnis eher wie echte Konsistenz in der Abbildung zwischen Datensätzen als wie ein numerischer Zufall, der unter beliebigen Abbildungen erreichbar wäre.


8 | Robustheit und Kontrollen: Wie vermeidet P1, nur ein „gut aussehender Fit“ zu sein?

Der naheliegendste Einwand gegen einen technischen Bericht lautet: Kommt der Vorteil von einer bestimmten Rauscheinstellung, einem Zuschnitt der Zentralregionen, einer Kovarianzbehandlung oder von Überanpassung? P1 beantwortet das mit mehreren Stresstests.

Tabelle 2 | Wie man die Robustheitstests und Negativkontrollen von P1 liest

Test

Welchen Einwand er ausschließen soll

Wie man ihn liest

σ_int-Scan

Bleibt die Schlussfolgerung stabil, wenn RC zusätzliche unbekannte Streuung enthält?

Nach Lockerung der RC-Fehler bleiben EFT-Rangfolge und Vorteilsmaßstab stabil.

R_min-Scan

Bleibt die Schlussfolgerung stabil, wenn die Zentralregionen der Galaxien nicht vollständig vertrauenswürdig sind?

Nach dem Beschneiden der Zentralregionen behält EFT weiterhin einen positiven Vorteil.

cov-shrink-Scan

Bleibt die Schlussfolgerung stabil, wenn die GGL-Kovarianzschätzung unsicher ist?

Nach Schrumpfung der Kovarianz zur Diagonalen ist der Vorteil nicht empfindlich.

Ablationsleiter

Stützt sich EFT auf unnötige Komplexität, um einen Fit zu erzwingen?

Das vollständige EFT_BIN wird durch die Informationskriterien gestützt.

LOO-Vorhersage mit Zurückhalten

Erklärt das Modell nur Daten, die es bereits gesehen hat?

Nach Zurückhalten eines GGL-bins zeigt das Modell weiterhin starke Generalisierungsleistung.

RC-bin-Shuffle

Kommt Closure aus der echten Abbildung?

Closure fällt nach dem Mischen der Gruppierung ab und stützt damit die Abbildungsabhängigkeit.

Abbildung R2 | Bereich von ΔlogL_total im σ_int-Scan (größer ist besser).

Wie diese Abbildung zu lesen ist

Testet, ob der Vorsprung der EFT nach Änderungen der angenommenen intrinsischen RC-Streuung bestehen bleibt.

Abbildung R3 | Bereich von ΔlogL_total im R_min-Scan (größer ist besser).

Wie diese Abbildung zu lesen ist

Testet, ob der Vorteil der EFT stabil bleibt, nachdem komplexe Zentralregionen beschnitten wurden.

Abbildung R4 | Bereich von ΔlogL_total im cov-shrink-Scan (größer ist besser).

Wie diese Abbildung zu lesen ist

Testet, ob die Rangfolge empfindlich auf Änderungen der Kovarianzbehandlung in der schwachen Linsenwirkung reagiert.

Abbildung R5 | EFT_BIN-Ablationsleiter (AICc, kleiner ist besser).

Wie diese Abbildung zu lesen ist

Testet, ob das vollständige EFT_BIN zur Erklärung der Daten notwendig ist und nicht bloß überflüssige Parameter hinzufügt.

Abbildung R6 | LOO: Log-Likelihood-Verteilung für zurückgehaltene bins.

Wie diese Abbildung zu lesen ist

Testet, ob das Modell auch auf ungesehenen GGL-bins Vorhersageleistung besitzt.

Abbildung R7 | Negativkontrolle: Gemischte Abbildung verursacht einen deutlichen Rückgang des Closure-mean logL_true.

Wie diese Abbildung zu lesen ist

Zeigt aus der Perspektive des mittleren logL_true zusätzlich, dass Closure von der korrekten Abbildung zwischen Datensätzen abhängt.


9 | P1A: Warum „mehrere DM-Modelle im Anhang“ eine zentrale Korrektur sind

In diesem Abschnitt geht es nicht um die Frage: „Hat EFT nur eine minimale DM_RAZOR-Basislinie geschlagen?“ Gefragt wird vielmehr, ob sich die Schlussfolgerungen aus Closure-Test und gemeinsamem Fit ändern, wenn die DM-Basislinie innerhalb eines niedrigdimensionalen, reproduzierbaren und klar dokumentierten Parameterbuchs (P1A) verstärkt wird. P1A soll also den Einwand abschwächen, man habe „nur eine zu schwache DM-Basislinie gewählt“, und die Diskussion darauf verlagern, ob sich das Closure-Verhalten auch unter einer Reihe prüffähiger DM-Erweiterungen unterscheidet.

P1A soll nicht alle möglichen LambdaCDM-Halo-Modellierungen erschöpfen und verwandelt die DM-Seite auch nicht in einen hochdimensionalen, unprüfbaren Fitter. Es wählt niedrigdimensionale, reproduzierbare Erweiterungen mit klarem Parameterbuch: Konzentrationsstreuung, adiabatische Kontraktion, Feedback-Kern, hierarchischer c–M-Streuungsprior, Ein-Parameter-Kernproxy, Störparameter für die Scher-Kalibrierung schwacher Linsenwirkung und die kombinierte DM_STD-Basislinie.

Hauptlesart von P1A

Unter den drei Legacy-Zweigen erzeugt nur Feedback/Kern eine kleine Nettozunahme der Closure-Stärke; SCAT und AC erzeugen keine Netto-Closure-Gewinne.

DM_HIER_CMSCAT, DM_RAZOR_M und DM_CORE1P haben nur sehr geringe Wirkung auf die Closure-Stärke oder zeigen keine deutliche Nettoverbesserung.

DM_STD kann das gemeinsame logL deutlich verbessern, aber seine Closure-Stärke sinkt; das deutet darauf hin, dass vor allem die Flexibilität des gemeinsamen Fits verbessert wird, nicht die RC→GGL-Transfer-Vorhersagekraft.

EFT_BIN behält in Tabelle B1 von P1A weiterhin höhere Closure-Stärke und einen Vorteil im gemeinsamen Fit; daher sollte die Kernbehauptung von P1 nicht auf „es hat nur minimale DM_RAZOR geschlagen“ reduziert werden.

Abbildung B1 | P1A-Scoreboard: Closure und gemeinsames ΔlogL relativ zur Basislinie (größer ist besser).

Wie diese Abbildung zu lesen ist

Diese Abbildung zeigt die Leistung mehrerer DM-Erweiterungszweige relativ zur Basislinie.

Ihre Bedeutung ist nicht „alle DM ist ausgeschlossen“, sondern: Innerhalb der von P1A ausgewählten niedrigdimensionalen, prüffähigen DM-Erweiterungen beseitigt eine Verstärkung von DM den Closure-Vorteil von EFT_BIN nicht.


10 | Warum das P1-Experiment wichtig ist


10.1 Methodische Bedeutung: „Closure über Sonden hinweg“ über „Einzelsonden-Fit“ stellen

Theorien auf Galaxienskalen können leicht bei der Frage hängen bleiben, ob ein Modell eine bestimmte Menge von Rotationskurven anpassen kann. P1 hebt die Frage eine Ebene höher: Können aus RC gelernte Parameter schwache Linsenwirkung vorhersagen, ohne erneut auf GGL nachzujustieren? Dadurch wird P1 von einem „Fit-Wettbewerb“ zu einem „Transfer-Vorhersagetest“.

10.2 Bedeutung für Transparenz: Die Reproduzierbarkeitskette als Teil des Ergebnisses behandeln

Ein wichtiger Beitrag von P1 besteht darin, Daten, Tabellen und Abbildungen, Run-Labels, Negativkontrollen, Reproduktionspaket und Audit-Kette gemeinsam zu veröffentlichen. Das ist für Befürworter wie Kritiker wichtig: Die Diskussion kann auf dieselben öffentlichen Daten, dieselbe Abbildung, dieselben Skripte und dieselben Metriken zurückgeführt werden, statt nur Schlagworte zu vergleichen.

10.3 Physikalische Bedeutung: Ein starker Stresstest für Richtungen der „Gravitation ohne Dunkle Materie“

In Gravitationsrichtungen ohne Dunkle Materie können viele Modelle einen Teil der Rotationskurven oder der RAR erklären. Schwieriger ist es, zugleich schwache Linsenanzeigen zu bestehen und unter Negativkontrollen zu zeigen, dass das Signal von der korrekten Abbildung abhängt. P1 ist wichtig, weil es die mittlere Gravitationsantwort der EFT in ein Protokoll bringt, das einer externen Prüfung ähnelt: RC ist das Trainingsfeld, GGL das Transferfeld, und Shuffle das Anti-Schummelfeld.


10.4 Ist dies ein wichtiges Experiment für das Feld der „Gravitation ohne Dunkle Materie“?

Vorsichtig formuliert: Wenn die Datenverarbeitung, das Reproduktionspaket und das Closure-Protokoll von P1 externer Prüfung standhalten, kann es als ein ernstzunehmendes RC+GGL-Closure-Experiment in Richtungen ohne Dunkle Materie beziehungsweise in modifizierter Gravitation gelten. Seine Bedeutung liegt nicht im Schlagwort „Dunkle Materie ist widerlegt“, sondern darin, ein kriterienbasiertes, reproduzierbares, angreifbares und erweiterbares Maß über verschiedene Sonden hinweg bereitzustellen.

Gibt es bereits RC+GGL-Vorhersage-Closure-Rahmen auf derselben Ebene?

Es gibt relevante Rahmen und Beobachtungstraditionen: MOND/RAR organisiert viele Rotationskurvenphänomene gut; die KiDS-1000-Arbeit zur schwachen Linsen-RAR verglich ebenfalls MOND, Verlindes emergente Gravitation und LambdaCDM-Modelle; LambdaCDM kann manche schwache-Linsen-/Dynamikphänomene ebenfalls über Galaxie-Halo-Verbindungen, Gashalos und Feedback-Modellierung erklären.

Die präzise Behauptung von P1 lautet jedoch nicht, dass „kein anderer Rahmen der Welt RC+GGL erklären kann“. Vielmehr berichtet EFT unter P1s eigenem öffentlichen Protokoll – feste Abbildung, RC-only→GGL-Closure, Shuffle-Negativkontrollen, Parameterbuch und P1A-Stresstests mit mehreren DM-Zweigen – eine stärkere Closure-Leistung.

Mit anderen Worten: Der Teil von P1, der extern am meisten getestet werden sollte, ist sein konkretes, reproduzierbares Vergleichsprotokoll. Ein sehr sinnvoller nächster Schritt wäre zu prüfen, ob MOND/RAR, LambdaCDM/HOD, hydrodynamische Simulationen oder andere Rahmen modifizierter Gravitation unter demselben Protokoll gleiche oder höhere Closure-Werte erreichen können.


11 | Was kann P1 schließen, und was nicht?

Tabelle 3 | Grenzen der Schlussfolgerungen von P1

Kann schließen

Unter den RC+GGL-Daten von P1, der festen Abbildung und dem Hauptvergleichsprotokoll hat die EFT-Familie höhere Werte im gemeinsamen Fit und in der Closure-Stärke als die minimale DM_RAZOR.

Kann schließen

Innerhalb des niedrigdimensionalen, prüffähigen DM-Erweiterungsbereichs von P1A beseitigen mehrere DM-Erweiterungen den Closure-Vorteil von EFT_BIN nicht.

Kann schließen

Die Shuffle-Negativkontrolle zeigt, dass das Closure-Signal von der korrekten Abbildung zwischen Datensätzen abhängt und unter beliebigen Abbildungen nicht erreichbar ist.

Kann nicht schließen

Man kann nicht sagen, P1 habe alle Dunkle-Materie-Modelle widerlegt. P1A erschöpft weiterhin nicht Nicht-Sphärizität, Umweltabhängigkeit, komplexe Galaxie-Halo-Verbindungen, hochdimensionales Feedback oder vollständige kosmologische Simulationen.

Kann nicht schließen

Man kann nicht sagen, der vollständige EFT-Rahmen sei aus ersten Prinzipien bewiesen. P1 testet nur die phänomenologische Ebene der mittleren Gravitationsantwort.

Kann nicht schließen

Man kann nicht sagen, alle Systematiken seien ausgeschlossen. P1 liefert Robustheitshinweise nur innerhalb der aufgeführten Stresstests und des Audit-Umfangs.


12 | Häufige Fragen allgemeiner Leser

F1: Bedeutet das, dass „Dunkle Materie nicht existiert“?

Nein. Die Schlussfolgerungen von P1 müssen auf die hier verwendeten Daten, das Protokoll und die Vergleichsmodelle beschränkt bleiben. P1A geht über die minimale DM_RAZOR hinaus, repräsentiert aber weiterhin nicht alle möglichen Dunkle-Materie-Modelle.

F2: Bedeutet das, dass „EFT bewiesen wurde“?

Ebenfalls nein. P1 testet EFT als Parametrisierung einer mittleren Gravitationsantwort und zeigt stärkere Leistung im RC→GGL-Closure-Test; der mikroskopische Mechanismus und die vollständige Theorie sind nicht die Schlussfolgerung von P1.

F3: Warum wird kein Signifikanzwert direkt in σ angegeben?

P1 verwendet einheitliche Likelihood-Werte, Informationskriterien und Closure-Differenzen. ΔlogL ist ein relativer Vorteil unter derselben Bewertungsregel; es entspricht keinem einzelnen σ-Wert.

F4: Warum RC-bin→GGL-bin mischen?

Das ist eine Negativkontrolle. Ein reales Signal über verschiedene Sonden hinweg sollte von der korrekten Abbildung abhängen; bliebe es nach dem Mischen ebenso stark, würde das eher auf eine mögliche Implementierungsverzerrung oder ein statistisches Scheinsignal hindeuten.

F5: Was sollte P1 als Nächstes tun?

Dasselbe Protokoll auf mehr Daten, mehr DM-Vergleiche, komplexere Systematiken und weitere Rahmen modifizierter Gravitation ausweiten – besonders so, dass externe Teams unter derselben Closure-Metrik erneut testen können.


13 | Mini-Glossar

Tabelle 4 | Mini-Glossar

Begriff

Erklärung in einem Satz

Rotationskurve (RC)

Die Beziehung zwischen Radius und Rotationsgeschwindigkeit in einer Galaxienscheibe; sie dient zur Ableitung der effektiven Gravitation innerhalb der Scheibe.

Schwache Linsenwirkung (GGL)

Ein Maß für die mittlere Gravitations-/Massenverteilung um Vordergrundgalaxien, abgeleitet aus der statistischen Verzerrung der Formen von Hintergrundgalaxien.

Closure-Test

Verwendet den RC-Posterior zur Vorhersage von GGL und vergleicht das Ergebnis mit der Negativkontrolle aus gemischter Abbildung.

Negativkontrolle

Zerstört absichtlich eine zentrale Struktur, um zu prüfen, ob das Signal verschwindet; dient dem Ausschluss falscher Signale.

NFW-Halo

Ein Dichteprofil für Dunkle-Materie-Halos, das in Modellen kalter Dunkler Materie häufig verwendet wird.

c–M-Beziehung

Die Beziehung zwischen Halo-Konzentration c und Masse M; ob Streuung zugelassen wird, beeinflusst die Modellflexibilität.

DM_STD

Der standardisierte DM-Stresstestzweig in P1A, der mehrere niedrigdimensionale DM-Erweiterungen und einen Linsen-Störparameter kombiniert.

ΔlogL

Die Log-Likelihood-Differenz zwischen zwei Modellen unter derselben Bewertungsregel; ein positiver Wert bedeutet, dass ersteres besser ist.

Kovarianz

Eine Matrixbeschreibung von Korrelationen zwischen Datenpunkten; Daten schwacher Linsenwirkung benötigen meist die vollständige Kovarianz.


14 | Empfohlener Lesepfad und Zitations-Einstiegspunkte

1. Lesen Sie zunächst die Abschnitte 0–2 dieses Leitfadens, um die Fragestellung von P1 und die bewusst zurückhaltende Rolle der EFT in P1 zu verstehen.

2. Lesen Sie anschließend Abbildung S3, Abbildung S4 und die Tabellen S1a/S1b, um Closure-Stärke, gemeinsamen Fit und Negativkontrollen zu verstehen.

3. Wenn Sie befürchten, die „DM-Basislinie sei zu schwach“, gehen Sie direkt zu Abschnitt 9 und Tabelle B1 / Abbildung B1.

4. Zur technischen Überprüfung kehren Sie zum technischen Bericht P1 v1.1, zum Tabellen- und Abbildungs-Supplement sowie zum full_fit_runpack zurück.

Wichtige Archiv-Einstiegspunkte

Technischer P1-Bericht (Release-Ebene, Concept DOI): 10.5281/zenodo.18526334

Vollständiges P1-Reproduktionspaket (Concept DOI): 10.5281/zenodo.18526286

Strukturierte EFT-Wissensbasis (optional, Concept DOI): 10.5281/zenodo.18853200

Lizenzhinweis: Der technische Bericht verwendet CC BY-NC-ND 4.0; das vollständige Reproduktionspaket verwendet CC BY 4.0 (maßgeblich sind der technische Bericht und die Zenodo-Archive).


15 | Literatur und externer Hintergrund

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.