← Experimente

P1_RC_GGL: Strenger Closure-Test der Galaxiendynamik und der schwachen Gravitationslinsenwirkung (Rotationskurven + GGL)

EFT-Rahmen der mittleren Gravitation vs. minimale NFW-Basislinie für kalte Dunkle Materie (DM)

Autor: Guanglin Tu
E-Mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Affiliation: EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Version: v1.1 | Datum: 2026-02-14

Preprint (nicht peer-reviewt) | Diese Version ist für öffentliche Verbreitung und Reproduzierbarkeit bestimmt und stellt nicht die endgültige in einer Fachzeitschrift veröffentlichte Fassung dar.

Lizenz: Bericht (CC BY-NC-ND 4.0); vollständiges Reproduktionspaket (CC BY 4.0).

Publikationsreifer Bericht (Concept DOI): https://doi.org/10.5281/zenodo.18526334 Vollständiges Reproduktionspaket (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Zusammenfassung

Dieser Bericht ist eine publikationsreife Archivfassung, die auf Zenodo hinterlegt wurde. Er stellt eine integrierte, auditierbare Kette bereit, die Daten, Modell-Ledger, faire Vergleichsregeln, Closure-Tests und Reproduzierbarkeitsmaterialien umfasst. Anhang B (P1A) dient als Robustheitsergänzung. Er konzentriert sich auf Stresstests mit einer „standardnäheren DM-Basislinie + einer zentralen Lensing-Systematik“, um zu prüfen, wie empfindlich die Hauptschlussfolgerungen gegenüber realistischeren DM-Modellen und der Behandlung von Lensing-Systematiken sind.

Kernschlussfolgerungen (vier direkt zitierfähige Aussagen; siehe Abschnitt 2.4):

(1) Bei der Anpassung der Rotationskurven (RC) übertrifft die EFT-Familie DM_RAZOR unter allen Kern-/Prior-Kombinationen deutlich; eine typische Verbesserung beträgt Δlog𝓛_RC ≈ 10^3 (siehe Tabelle S1a).
(2) Im RC→GGL-Closure-Test zeigt EFT eine stärkere Übertragbarkeit zwischen den Sonden: Die Closure-Stärke Δlog𝓛_closure (True−Perm) liegt deutlich über der von DM_RAZOR, und der Unterschied bleibt gegenüber Kovarianz-Shrinkage, R_min- und σ_int-Scans robust (siehe Abb. S3 und Tabelle S1b).
(3) In der gemeinsamen Anpassung (RC+GGL) behält EFT einen stabilen Vorteil; unter der Negativkontrolle, die die gemeinsame Zuordnung zerstört, bricht dieser Vorteil zusammen. Das stützt die Deutung, dass der „mittlere Gravitationseffekt“ aus der gemeinsamen Zuordnung und nicht aus einer zufälligen Anpassung stammt (siehe Abb. S4).
(4) Ohne die Dimensionalität wesentlich zu erhöhen, unterzieht Anhang B (P1A) die DM-Seite mit standardnäheren DM-Basislinienmodulen und einer zentralen Lensing-Systematik-Nuisance einem Stresstest. Diese Erweiterungen beseitigen den Closure-Vorteil von EFT nicht (siehe Tabelle B1 und Abb. B1).

Verfügbarkeit von Daten und Code: Bericht Concept DOI 10.5281/zenodo.18526334; vollständiges Reproduktionspaket Concept DOI 10.5281/zenodo.18526286. Die zu Anhang B (P1A) gehörenden Tags lauten run_tag=20260213_151233, closure_tag=20260213_161731 und joint_tag=20260213_195428.

1 Abstract

Wir führen einen reproduzierbaren quantitativen Vergleich zweier theoretischer Rahmen unter denselben Daten und demselben statistischen Protokoll durch: des von der Energie-Filament-Theorie (Energy Filament Theory, EFT; nicht zu verwechseln mit der üblichen Abkürzung für effective field theory) vorgeschlagenen Modells der „mittleren Gravitationskorrektur“ und eines NFW-Halobasislinienmodells für kalte Dunkle Materie (DM_RAZOR). DM_RAZOR wird bewusst als „minimale DM-Basislinie“ gewählt: ein NFW-Halo mit fester c–M-Relation (ohne Halo-zu-Halo-Streuung), der als auditierbare und reproduzierbare Kontrolle dient. Ebenfalls zu betonen ist, dass diese Arbeit EFT als phänomenologische, MOND-ähnliche Effektivfeld-/Effektivantwort-Parametrisierung behandelt, die unter einem einheitlichen statistischen Protokoll getestet wird, statt hier ihre mikroskopischen ersten Prinzipien herzuleiten.

Die Daten bestehen aus 2.295 Geschwindigkeitsdatenpunkten aus SPARC-Rotationskurven (RC), die einheitlich vorverarbeitet und gebinnt wurden (104 Galaxien, 20 RC-Bins), sowie aus der Überschuss-Oberflächendichte ΔΣ(R) der KiDS-1000-Galaxie-Galaxie-schwachen-Linsenmessung (GGL) (4 Sternmassen-Bins × 15 R-Punkte je Bin, insgesamt 60 Punkte, unter Verwendung der vollständigen Kovarianz).

Wir führen nacheinander RC-only-Inferenz, einen RC→GGL-Closure-Test, GGL-only-Inferenz und gemeinsame RC+GGL-Inferenz durch und verwenden Konsistenzaudits, um sicherzustellen, dass jeder zitierte Zahlenwert rückverfolgbar ist. Unter einem strengen Parameter-Ledger und gemeinsamen Zuordnungsbedingungen (DM: 20 log M200_bin-Parameter; EFT: 20 log V0_bin-Parameter + 1 globales log ℓ) übertrifft die EFT-Familie DM_RAZOR in der gemeinsamen Anpassung deutlich: ΔlogL_total = 1155–1337 relativ zu DM_RAZOR. Wichtiger noch zeigt der Closure-Test, dass der RC-Posterior eine nichttriviale Vorhersagekraft für GGL besitzt: Die Closure-Stärke von EFT beträgt ΔlogL_closure = 172–281 und liegt damit über den 127 von DM_RAZOR. Wenn die RC-bin→GGL-bin-Gruppierung zufällig gemischt wird, bricht das Closure-Signal auf 6–23 ein; dies bestätigt, dass das Signal weder ein statistischer Zufall noch ein Implementierungsartefakt ist. Über systematische Scans von σ_int, R_min und Kovarianz-Shrinkage hinweg bleibt der relative Vorteil von EFT positiv und in seiner Größenordnung stabil. Um verbreitete Einwände zu adressieren, wonach die „DM-Basislinie zu schwach“ sei oder „Systematiken für Physik gehalten“ würden, bietet Anhang B (P1A) einen standardnäheren, aber weiterhin niedrigdimensionalen und auditierbaren Stresstest der DM-Basislinie, einschließlich hierarchischer c–M-Streuung + Prior, eines einkomponentigen Core-Proxys, Lensing-m und des kombinierten DM_STD-Modells. Unter demselben Closure-Protokoll beseitigen diese Erweiterungen den Closure-Vorteil von EFT nicht (siehe Tabelle B1/Abb. B1).

Schlüsselwörter: Rotationskurven; Galaxie-Galaxie-schwache Linsenwirkung; Closure-Test; EFT; kalte Dunkle Materie; Bayes’sche Inferenz

2 Einleitung und Ergebnisüberblick

Rotationskurven (RC) und Galaxie-Galaxie-schwache Linsenwirkung (GGL) sind zwei komplementäre Gravitationssonden: RC beschränkt das dynamische Potential und die radiale Beschleunigungsrelation (RAR) in der Scheibenebene, während GGL die projizierte Massenverteilung und die Gravitationsantwort auf Halo-Skalen misst. Für jede Kandidatentheorie lautet die entscheidende Frage nicht, ob sie die beiden Datensätze getrennt anpassen kann, sondern ob sie beide unter derselben datenübergreifenden Zuordnung und denselben gemeinsamen Beschränkungen konsistent erklären kann.

Dementsprechend verwendet diese Arbeit den „Closure-Test“ als ihr zentrales statistisches Protokoll: Zunächst wird der RC-only-Posterior genutzt, um GGL vorwärts vorherzusagen; anschließend wird dies mit einer Negativkontrolle verglichen, in der die RC-bin→GGL-bin-Zuordnung permutiert/geshuffelt wird. Damit wird die datenübergreifende prädiktive Übertragbarkeit bewertet und es werden Scheinsignale ausgeschlossen, die durch Implementierungsbias oder zufällige Anpassung entstehen könnten.

Theoretische Einordnung und Umfang: Diese Arbeit versucht nicht, eine mikroskopische Herleitung der ersten Prinzipien von EFT (Energie-Filament-Theorie; Energy Filament Theory) oder eine relativistisch vollständige Formulierung vorzulegen. Stattdessen behandeln wir EFT als niedrigdimensionale, MOND-ähnliche Effektivfeld-/Effektivantwort-Parametrisierung (beschrieben durch eine Kernfunktion f(x) und eine globale Skala ℓ) und testen ihre datenübergreifende Konsistenz und Übertragungsvorhersagekraft über den RC→GGL-Closure-Test unter einem strengen Parameter-Ledger.

Forschungsprogramm und Umfangserklärung: Diese Arbeit ist Teil eines laufenden Beobachtungs-Retrieval-Programms der P-Serie. In vorhandenen Daten auf Galaxienskalen suchen wir nach zwei möglichen effektiven Hintergrundbeiträgen: (i) einem „mittleren Gravitationsboden“, der durch eine grob gemittelte mittlere Gravitationsantwort beschreibbar ist, und (ii) einem „stochastischen/Rauschboden“, der mit Fluktuationen mikroskopischer Prozesse zusammenhängt. In dieser Arbeit (P1) konzentrieren wir uns ausschließlich auf den ersten Beitrag: Ohne eine Hypothese über mikroskopische Produktionsmechanismen einzuführen, nutzen wir den RC→GGL-Closure-Test, um beobachtungsseitige Hinweise auf einen mittleren Gravitationsboden zu gewinnen und ihn unter einem einheitlichen Kontrollprotokoll mit einer auditierbaren DM-Basislinie zu vergleichen. Als heuristisches physikalisches Bild gilt: Wenn kurzlebige Freiheitsgrade existieren, kann ihr Zerfall/ihre Annihilation Ruhemasse in Energie-Impuls umwandeln, der von anderen Freiheitsgraden getragen wird; auf effektiver Ebene entspricht dies natürlich einer Zerlegung in „mittleren Beitrag + Fluktuationsbeitrag“. Diese Arbeit modelliert dieses mikroskopische Bild jedoch nicht quantitativ.

Um Überinterpretation zu vermeiden, lauten die Grenzen dieser Arbeit wie folgt:
• Was diese Arbeit leistet: Unter strengen Parameter-Ledger- und gemeinsamen Zuordnungsbedingungen misst sie mit Closure-Tests die datenübergreifende prädiktive Übertragbarkeit und führt einen reproduzierbaren Vergleich zwischen der EFT-Antwort der mittleren Gravitation und einer DM-Basislinie durch.
• Was diese Arbeit nicht leistet: Sie diskutiert keine mikroskopischen Produktionsmechanismen, Häufigkeiten/Lebensdauern oder kosmologischen Beschränkungen; sie modelliert den dem „Rauschboden“ entsprechenden stochastischen Term nicht.
• Was diese Arbeit nicht behauptet: Sie zielt nicht darauf, Dunkle Materie zu stürzen; P1 liefert kein endgültiges Urteil darüber, ob ein „Boden“ existiert, sondern berichtet Evidenz auf Zwischenstufenniveau — dass die Daten innerhalb des hier gewählten robusten Messbereichs Modelle bevorzugen, die eine mittlere Gravitationsantwort enthalten.

Zugleich stellen wir klar, dass DM_RAZOR nur eine minimale und auditierbare NFW-Basislinie darstellt (feste c–M-Relation und keine Streuung; keine adiabatische Kontraktion, kein Feedback-Core, keine Nicht-Sphärizität und keine Umweltterme). Daher ist die Hauptschlussfolgerung des Textkörpers strikt auf folgende Aussage beschränkt: Unter der minimalen Basislinie und strengen Parameter-Ledger-/Zuordnungsbedingungen zeigt EFT eine stärkere datenübergreifende Konsistenz. Um die verbreitete Frage zu adressieren, ob eine standardnähere ΛCDM-Basislinie und die Modellierung zentraler Lensing-Systematiken die Schlussfolgerung wesentlich verändern würden, bündeln wir standardnähere, aber weiterhin niedrigdimensionale und auditierbare DM-Erweiterungen sowie eine Lensing-seitige Nuisance in Anhang B (P1A: Stresstest zur Standardisierung der DM-Basislinie), wobei exakt dieselbe gemeinsame Zuordnung und dasselbe Closure-Test-Protokoll wie im Haupttext beibehalten werden (siehe Tabelle B1/Abb. B1).

2.1 Tab. S1a–S1b: Zusammenfassung der Schlüsselmetriken (Strict)

Tabelle S1a berichtet die Hauptvergleichsmetriken für die gemeinsame Anpassung (RC+GGL): logL, ΔlogL, AICc und BIC. Tabelle S1b berichtet Metriken für Closure-Test und Robustheits-Scans: Closure, Shuffle-Negativkontrolle sowie die Scanbereiche für σ_int / R_min / cov-shrink. Alle Werte stammen aus der strengen Master-Zusammenfassungstabelle Tab_Z1_master_summary und können im Release-Archivpaket Punkt für Punkt zurückverfolgt werden.

Tabelle S1a | Hauptvergleichsmetriken der gemeinsamen Anpassung (RC+GGL, Strict).

Modell (Workspace)

W-Kern

k

Gemeinsamer logL_total (best)

ΔlogL_total vs. DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelle S1b | Closure- und Robustheitsmetriken (Strict).

Modell (Workspace)

Closure ΔlogL (true-perm)

ΔlogL der Negativkontrolle nach Shuffle

σ_int-Scan ΔlogL-Bereich

R_min-Scan ΔlogL-Bereich

cov-shrink-Scan ΔlogL-Bereich

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Abb. S3: Closure-Stärke (RC-only → vorhergesagtes GGL)

Die Closure-Stärke ist definiert als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: Auf RC-only-Posteriorsamples wird GGL vorwärts vorhergesagt und mit einer Negativkontrolle verglichen, in der die RC-bin→GGL-bin-Zuordnung permutiert wird.

Abb. S3 | Closure-Stärke (höher ist besser): mittlerer Log-Likelihood-Vorteil der RC-only → GGL-Vorhersage.


2.3 Abb. S4: Hauptvergleich der gemeinsamen Anpassung (RC+GGL)

Der Vorteil der gemeinsamen Anpassung ist definiert als ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Unter denselben Daten, derselben Zuordnung und nahezu derselben Parameterskala erreicht die EFT-Familie eine deutlich höhere gemeinsame Log-Likelihood.

Abb. S4 | Vorteil der gemeinsamen Anpassung (höher ist besser): bester logL_total für RC+GGL relativ zu DM_RAZOR.


2.4 Vier Schlussfolgerungen (direkt zitierfähig)

(1) In einer einheitlichen gemeinsamen Analyse von SPARC-Rotationskurven und KiDS-1000-schwacher Linsenwirkung übertrifft das EFT-Modell des mittleren Gravitationsrahmens DM_RAZOR unter einem strengen Kontrollprotokoll systematisch: ΔlogL_total = 1155–1337 relativ zu DM_RAZOR.

(2) Der RC→GGL-Closure-Test zeigt eine stärkere prädiktive Konsistenz für EFT: ΔlogL_closure = 172–281, verglichen mit 127 für DM_RAZOR. Wenn die RC-bin→GGL-bin-Gruppierung zufällig gemischt wird, bricht das Closure-Signal auf 6–23 ein; dies zeigt, dass das Signal von der korrekten datenübergreifenden Zuordnung abhängt und nicht von zufälliger Anpassung.

(3) Systematische Scans von σ_int, R_min und Kovarianz-Shrinkage ändern weder das Vorzeichen noch die Größenordnung von „EFT übertrifft DM_RAZOR“, was darauf hinweist, dass die Schlussfolgerung gegenüber üblichen systematischen Störungen robust ist.

(4) Unter demselben Closure-Protokoll stärkt Anhang B (P1A) die DM-Basislinie auf „standardisierte und auditierbare“ Weise: Er behält drei Ein-Parameter-Erweiterungen (SCAT/AC/FB) bei und fügt hierarchische c–M-Streuung + Prior, einen Ein-Parameter-Core-Proxy und eine Lensing-seitige Scherkalibrierung m hinzu (sowie deren kombiniertes DM_STD-Modell). Die Ergebnisse zeigen, dass nur der Feedback/Core-Zweig eine kleine Nettoverbesserung der Closure-Stärke bringt (122.21→129.45, ΔΔlogL_closure≈+7.25); die übrigen Erweiterungen tragen nur unerheblich oder negativ zur Closure-Stärke bei. Damit hängt die Hauptschlussfolgerung nicht davon ab, dass DM_RAZOR eine übermäßig schwache Basislinie ist.

3 Daten und Vorverarbeitung

Diese Studie verwendet zwei öffentliche Datensätze. Innerhalb des Engineering-Workflows werden Download, Prüfsummenverifikation (sha256) und Vorverarbeitung mit rückverfolgbaren Skripten durchgeführt. Um einen fairen modellübergreifenden Vergleich zu gewährleisten, verwenden alle Workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) exakt dieselben Datenprodukte und Bin-Zuordnungen.


3.1 Rotationskurven (RC, SPARC)

Die RC-Daten stammen aus den Rotmod_LTG-Dateien der SPARC-Datenbank (175 rotmod-Dateien). Nach der Vorverarbeitung umfasst die Modellierungsstichprobe 104 Galaxien und 2.295 (r, V_obs)-Datenpunkte, die nach Sternmasse und verwandten Kriterien in 20 RC-Bins aufgeteilt wurden. Jeder Datenpunkt enthält Radius r (kpc), beobachtete Geschwindigkeit V_obs (km/s), Beobachtungsfehler σ_obs sowie die Komponenten-Geschwindigkeiten von Gas/Scheibe/Bulge (V_gas, V_disk, V_bul).


3.2 Schwache Linsenwirkung (GGL, KiDS-1000 / Brouwer+2021)

Die GGL-Daten verwenden die Überschuss-Oberflächendichte ΔΣ(R) aus Abb. 3 von Brouwer et al. (2021) auf Basis von KiDS-1000 (4 Sternmassen-Bins, 15 R-Punkte je Bin) zusammen mit der bereitgestellten vollständigen Kovarianz. Im Engineering-Workflow wird die ursprüngliche Langform-Kovarianz für jeden Bin zu einer 15×15-Matrix rekonstruiert; Stage-B-Audits prüfen Dimensionen und numerische Plausibilität.


3.3 RC-bin → GGL-bin-Zuordnung und Gesamtstichprobengröße

Die 4 GGL-Massenbins und 20 RC-Bins werden über eine feste Zuordnung verbunden: Jeder GGL-Bin entspricht 5 RC-Bins, und RC-Bin-Beiträge werden nach der Anzahl der Galaxien gewichtet. Diese Zuordnung bleibt über alle Modelle hinweg fest und ist die Kernbeschränkung für faire Vergleiche in Closure-Tests und gemeinsamer Anpassung. Der endgültige gemeinsame Datensatz enthält n_total = 2355 Punkte (RC=2295, GGL=60).

4 Modelle und statistische Methoden


4.1 Minimale mathematische Spezifikation für EFT und DM (auditierbar/testbar)

Dieser Abschnitt gibt die minimale mathematische Spezifikation an, die direkt auf die Implementierung abgebildet wird.

(a) Rotationskurven-Modell (RC)

Für jeden RC-Datenpunkt (r, V_obs, σ_obs) verwenden wir Komponentenüberlagerung: V_mod²(r) = V_bar²(r) + V_extra²(r). Dabei gilt V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Die Hauptergebnisse dieser Arbeit setzen Υ_d = Υ_b = 0.5, im Einklang mit empirischen SPARC-Empfehlungen und nützlich zur Reduktion unnötiger Freiheitsgrade.

(b) EFT-Korrektur der mittleren Gravitation (EFT)

Der EFT-Zusatzterm wird in Form des „mittleren Geschwindigkeitsquadrats“ parametrisiert: V_extra²(r) = V0_bin² · f(r/ℓ). Dabei ist V0_bin der Amplitudenparameter für jeden RC-Bin (20 Parameter), ℓ eine globale Skala (1 Parameter), und f(x) eine dimensionslose Kernformfunktion. Die in dieser Arbeit verglichenen Kernformen (keine führt zusätzliche kontinuierliche Freiheitsgrade ein) sind:

Physikalische Motivation (erweitert): EFT interpretiert die zusätzliche Gravitationsantwort auf Galaxienskalen als effektive Antwort, die durch Grobkörnung/Skalenmittelung mikroskopischerer Wirkungen über endliche Skalen entsteht. In dieser Arbeit nehmen wir keinen konkreten mikroskopischen Mechanismus an; stattdessen verwenden wir eine minimale und auditierbare Parametrisierung für kontrollierten Vergleich und Testen unter einem einheitlichen statistischen Protokoll.

Zur Intuition kann der Zusatzterm in Beschleunigungsform geschrieben werden: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Für r≫ℓ gilt f→1 und V_extra→V0_bin, was einen ungefähr flachen Zusatzbeitrag zur äußeren Geschwindigkeit erzeugt. Für r≪ℓ und f(x)≈x kann eine charakteristische Beschleunigungsskala a0,bin≈V0_bin²/ℓ eingeführt werden (bis auf einen O(1)-Faktor der Kernfunktion) und liefert eine MOND-ähnliche Intuition für die Übergangsskala vom inneren zum äußeren Bereich.

Die hier verwendete diskrete Kernfamilie (none/exponential/yukawa/powerlaw_tail) kann als niedrigdimensionale Stellvertretung für verschiedene „Anfangssteigungen / Übergangsgeschwindigkeiten / langreichweitige Tails“ verstanden werden (etwa Yukawa-artige Abschirmung gegenüber einer länger auslaufenden Antwort). Sie dienen Robustheitsstresstests und sollen den Modellraum nicht erschöpfen. In der schwachen-Linsen-Komponente konstruieren wir aus V_avg(r) eine effektive Hüllmasse und -dichte und projizieren diese anschließend, um ΔΣ(R) zu erhalten. Diese effektive Dichte ist als effektive Beschreibung des Linsenpotentials unter den Annahmen sphärischer Symmetrie und schwacher-Feld-Abbildung zu verstehen (vollständige Details sind in Anhang A verschoben).

Alle oben genannten Kernformen erfüllen f(x)→1 für x→∞ (d. h. Sättigung V_extra²→V0²), während sie für x≪1 lineares oder sublineares Wachstum liefern: zum Beispiel exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Daher besitzen verschiedene Kernformen beobachtbare Unterschiede in der kleinradiusigen „Anfangssteigung“, der Übergangsgeschwindigkeit und dem äußeren Tail und können durch gemeinsame RC+GGL- und Closure-Tests unterschieden werden.

Die EFT-Vorhersage für die schwache-Linsen-Größe ΔΣ(R) wird gewonnen, indem aus V_avg(r) Hüllmasse und Dichte inferiert werden, gefolgt von Projektionsintegralen: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr und ΔΣ(R)=Σ̄(<R)−Σ(R). Die numerische Implementierung verwendet ein logarithmisches Gitter und verfeinert es in Ausnahmefällen adaptiv, um Stabilität und Reproduzierbarkeit zu gewährleisten.

(c) DM_RAZOR: NFW-Basislinie eines Halos aus kalter Dunkler Materie

Zugleich stellen wir klar, dass DM_RAZOR nur eine minimale, auditierbare NFW-Basislinie darstellt (feste c–M-Relation und keine Streuung; keine adiabatische Kontraktion, kein Feedback-Core, keine Nicht-Sphärizität und keine Umweltterme). Um das Risiko einer „Strohmann-Basislinie“ zu verringern, behauptet diese Arbeit nicht, dass solche Effekte nicht existieren. Stattdessen werden sie in Anhang B (P1A) als niedrigdimensionale und auditierbare Stresstests aufgenommen, einschließlich hierarchischer Behandlung der c–M-Streuung, eines Core-Proxys und einer Lensing-seitigen Scherkalibrierungs-Nuisance.


4.2 Modell-Ledger und fairer Vergleich (gemeinsame Parameter = Definition von Closure)

Die Anzahl der Parameter im Hauptvergleichsset lautet: DM_RAZOR k=20; EFT-Familie k=21 (der zusätzliche Parameter ist das globale log ℓ). Alle Modelle teilen dieselben RC-Daten, dieselben GGL-Daten und dieselbe Kovarianz, dieselbe RC-bin→GGL-bin-Zuordnung, dieselben baryonischen Terme und dieselben Einheitenumrechnungen. Außerdem ist die Kernform (none / exponential / yukawa / powerlaw_tail) eine diskrete Wahl und führt keinen zusätzlichen kontinuierlichen Parameter ein; dadurch wird verhindert, dass ein Vorteil durch „einen zusätzlichen Freiheitsgrad“ entsteht.


4.3 Likelihood, Priors und Sampler

Die RC-Likelihood ist diagonal-gaußförmig: σ_eff² = σ_obs² + σ_int². Die Hauptergebnisse fixieren σ_int=5 km/s, und Run-5 scannt σ_int. Die GGL-Likelihood verwendet für jeden Bin eine Gauß-Likelihood mit vollständiger Kovarianz: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Das gemeinsame Ziel ist logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Die Priors codieren hauptsächlich physikalisch zulässige Grenzen (Intervallbeschränkungen für log ℓ, log V0 und log M200); wenn freie Υ und σ_int aktiviert sind, werden schwach informative Priors verwendet (Details siehe Implementierung und Konfiguration des Release-Pakets).

Der Sampler verwendet einen adaptiven Block-Metropolis-Zufallsweg: Jeder Schritt aktualisiert nur einen zufälligen Teilblock des Parameterraums, um die Akzeptanzrate in hohen Dimensionen zu verbessern; die Schrittweite wird leicht anhand der fensterweisen Akzeptanzrate angepasst (Zielakzeptanzrate etwa 0.25). Die Hauptergebnisse verwenden den Quick Mode (Einstellungen wie n_steps=800), und jeder Workspace gibt Traces, Residuen und PPC-Plots für manuelle und skriptbasierte Audits aus.


4.4 Closure-Test und Negativkontrolle (Definition)

Der Closure-Test (Run-2) prüft, ob der RC-only-Posterior GGL ohne erneutes Anpassen von GGL vorhersagen kann. Konkret generiert er aus RC-only-Posteriorsamples ΔΣ(R) für 4 GGL-Bins vorwärts und berechnet logL_true mit der vollständigen Kovarianz; anschließend permutiert er zufällig die RC-bin→GGL-bin-Gruppenzuordnung, um logL_perm zu erhalten. Die Closure-Stärke ist definiert als ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Zusätzlich gruppiert Run-10 die 20 RC-Bins zufällig neu in 4×5 (shuffle) und berechnet Closure erneut, um zu testen, wie stark das Closure-Signal von der korrekten Zuordnung abhängt.

5 Hauptergebnisse und Interpretation


5.1 Ergebnisse der gemeinsamen Hauptanpassung (RC+GGL)

Der beste logL_total aus der gemeinsamen Anpassung und der relative Vorteil ΔlogL_total (relativ zu DM_RAZOR) sind in Tabelle S1a und Abb. S4 gezeigt. Im Hauptvergleichsset besitzt EFT_BIN den größten gemeinsamen Vorteil (ΔlogL_total=1337.210), während die übrigen EFT-Kernformen ebenfalls deutliche Vorteile behalten (1154.827–1294.442). Auch nach Informationskriterien (AICc/BIC) übertrifft die EFT-Familie DM_RAZOR deutlich, was darauf hinweist, dass der Vorteil nicht durch die Anzahl der Parameter verzerrt ist.

Hinweis: Der Hauptbeitrag zu ΔlogL_total≈1337 stammt aus dem RC-Term (ΔlogL_RC≈1065 in der gemeinsamen Zerlegung, etwa 80%). Dies lässt sich als moderate Verbesserung von etwa Δχ²≈0.90 pro Punkt über N=2295 RC-Datenpunkte verstehen, die sich unter einer diagonalen Gauß-Likelihood natürlich zu einem Vorteil der Größenordnung 10^3 aufsummiert. Zugleich liefern GGL und der Closure-Test unabhängige datenübergreifende Beschränkungen, und die Rangfolge bleibt unter σ_int-, R_min- und cov-shrink-Stresstests stabil (siehe Abschnitt 6 und Tabelle S1b).


5.2 Ergebnisse des Closure-Tests (RC-only → GGL)

Die zentrale Closure-Test-Größe ΔlogL_closure wird in Tabelle S1b und Abb. S3 berichtet. Die EFT-Familie erreicht Closure-Stärken von 171.977–280.513 und liegt damit über den 126.678 von DM_RAZOR. Das bedeutet, dass die von EFT aus den RC-Daten gewonnenen Posteriorsamples ohne zusätzliche datenübergreifende Freiheitsgrade eine stärkere übertragbare Vorhersagekraft für die GGL-Daten besitzen.

Die Negativkontrolle stützt zusätzlich die physikalische Relevanz des Closure-Signals: Wenn die RC-bin→GGL-bin-Gruppierung zufällig gemischt wird, sinkt die Closure-Stärke von EFT auf 6–15 (mit kleinen Unterschieden zwischen den Kernen), während die ursprüngliche Closure-Stärke bei 172–281 liegt. Dieser „Signaleinbruch“ schließt Scheinvorteile aus, die durch numerische Implementierung, Einheitenfehler oder unsachgemäße Kovarianzbehandlung entstehen könnten.

Abb. R1 | Negativkontrolle: Nach der Shuffle-Gruppierung sinkt das Closure-Signal deutlich (geplottet aus Tab_Z1-Metriken).


5.3 Bedeutung und Grenzen der Ergebnisse

Die Schlussfolgerung dieser Studie lautet: „Unter diesem Datensatz und diesem Protokoll übertrifft die EFT-Korrektur der mittleren Gravitation die getestete DM_RAZOR-Basislinie.“ Es muss betont werden, dass die DM-Seite nur eine minimale NFW-Basislinie mit fester c(M)-Relation verwendet, ohne Core-Bildung, Nicht-Sphärizität, Umweltterme oder komplexere Modelle der Galaxie-Halo-Verbindung. Daher behauptet dieses Manuskript nicht, alle DM-Modellfamilien auszuschließen. Vielmehr liefert es eine reproduzierbare, Closure-Test-zentrierte Kontrollbasislinie, um zu bewerten, ob RC und GGL konsistent durch dieselben datenübergreifenden Parameter und dieselbe Zuordnung erklärt werden können.

Um diese verbreitete Sorge zu adressieren, haben wir ein unabhängiges Erweiterungsprojekt P1A abgeschlossen (siehe Anhang B). Ohne die gemeinsame RC-bin→GGL-bin-Zuordnung oder den Audit-Rahmen zu ändern, stärkt es die DM-Basislinie auf „standardisierte und auditierbare“ Weise: Neben drei Ein-Parameter-Erweiterungen (SCAT/AC/FB) fügt es zusätzlich (i) hierarchische c–M-Streuung + Massen-Konzentrations-Prior (DM_HIER_CMSCAT), (ii) einen Ein-Parameter-Core-Proxy für baryonisches Feedback (DM_CORE1P) und (iii) eine Scherkalibrierungs-Nuisance m auf der schwachen-Linsen-Seite (DM_RAZOR_M) hinzu und berichtet ein kombiniertes Modell DM_STD; EFT_BIN bleibt als Kontrollreferenz erhalten.

• DM_RAZOR_SCAT (c–M-Streuung) — führt den Halo-zu-Halo-Konzentrationsstreuungsparameter σ_logc ein, um zu testen, ob eine feste c(M)-Relation die Erklärungskraft von DM systematisch unterschätzt;
• DM_RAZOR_AC (adiabatische Kontraktion) — verwendet einen einzelnen Parameter α_AC, um kontinuierlich zwischen „keiner Kontraktion“ und „Standardkontraktion“ zu interpolieren und so die Tendenz von Baryonen zu erfassen, den inneren Halo bei minimalen Kosten zu kontrahieren;
• DM_RAZOR_FB (Feedback/Core) — verwendet eine Core-Skala (z. B. log r_core), um zu beschreiben, wie die Bildung eines inneren Cores Rotationskurven unterdrückt, während die NFW-Approximation auf schwachen-Linsen-Skalen erhalten bleibt.

Das quantitative P1A-Scoreboard ist in Anhang B, Tabelle B1 / Abb. B1 (automatisch aus Tab_S1_P1A_scoreboard generiert) angegeben. In der Closure-Metrik liefert DM_RAZOR_FB eine kleine Nettoverbesserung (122.21→129.45, +7.25), während die übrigen Erweiterungen nur unerheblich oder negativ zur Closure-Stärke beitragen. Auf der Seite der gemeinsamen Anpassung kann das Hinzufügen eines hierarchischen c–M-Streuungspriors (DM_HIER_CMSCAT) oder des kombinierten Modells (DM_STD) logL gemeinsam deutlich verbessern, verbessert jedoch nicht die Closure-Stärke. Dies legt nahe, dass vor allem gemeinsame Anpassungsflexibilität und nicht datenübergreifende Übertragbarkeit hinzugefügt wird. Daher ist die Kernschlussfolgerung des Haupttexts wie folgt zu lesen: Unter strengen gemeinsamen Zuordnungs- und Closure-Test-Beschränkungen entsteht der datenübergreifende Konsistenzvorteil von EFT nicht dadurch, dass auf der DM-Seite eine „übermäßig schwache Basislinie“ gewählt wurde. Das zu Anhang B gehörende P1A-Release-Paket (ergänzende Tabellen/Abbildungen und full_fit_runpack) wird als zusätzliche Dateien unter derselben Zenodo Concept DOI wie das full_fit_runpack dieser Arbeit aufgenommen: https://doi.org/10.5281/zenodo.18526286.

6 Robustheits- und Kontrollexperimente


6.1 σ_int-Scan (Run-5)

Wir scannen systematisch die intrinsische RC-Streuung σ_int und wiederholen die gemeinsame Inferenz bei jedem σ_int, wobei ΔlogL_total relativ zu DM_RAZOR berechnet wird. Die Minimal-/Maximalwerte von ΔlogL_total für jedes Modell über den Scanbereich hinweg werden in Tabelle S1b berichtet.

Abb. R2 | Bereich von ΔlogL_total unter dem σ_int-Scan (höher ist besser).


6.2 R_min-Scan (Run-6)

Um den Einfluss von Systematiken in den Daten zentraler Regionen zu testen (etwa nichtkreisförmige Bewegung, Auflösung und unzureichende baryonische Modellierung), wenden wir R_min-Schwellenwertschnitte auf RC an und wiederholen die gemeinsame Inferenz. Der Vorteil der EFT-Familie bleibt im R_min-Scan positiv und in seiner Größenordnung stabil.

Abb. R3 | Bereich von ΔlogL_total unter dem R_min-Scan (höher ist besser).


6.3 cov-shrink-Scan (Run-7)

Um Unsicherheiten in der GGL-Kovarianz zu testen, wenden wir Shrinkage auf die Kovarianzmatrix jedes Massenbins an: C_α=(1−α)C+α·diag(C), und scannen α. Die Ergebnisse zeigen, dass der Vorteil der EFT-Familie gegenüber dieser Behandlung unempfindlich ist.

Abb. R4 | Bereich von ΔlogL_total unter dem cov-shrink-Scan (höher ist besser).


6.4 Ablationsleiter (Run-8)

Innerhalb von EFT_BIN führen wir verschachtelte Ablationen durch: von einem Minimalmodell (ohne freie Parameter) über Versionen, die nur eine kleine Zahl von Freiheitsgraden beibehalten, bis zum vollständigen Modell mit 20-Bin-Amplitude + globaler Skala. AICc/BIC zeigen, dass das vollständige EFT_BIN-Modell von den Daten stark gefordert wird.

Abb. R5 | EFT_BIN-Ablationsleiter (AICc; niedriger ist besser).


6.5 Holdout-Vorhersage (Run-9)

Zusätzlich führen wir einen Leave-one-bin-out-Test (LOO) durch: Unter den 4 GGL-Massenbins wird jeweils ein Bin zurückgehalten; die Inferenz wird mit den übrigen Bins (und allen RC) erneut durchgeführt, und die Test-Log-Likelihood wird anschließend auf dem zurückgehaltenen Bin bewertet. Zusammenfassende Metriken sind in der Ergänzungstabelle Tab_R3_leave_one_bin_out angegeben (ein Run-9-Produkt; Dateipfadmuster sind in der Schlüsselproduktliste in Abschnitt 8.2 aufgeführt). Die EFT-Familie bleibt selbst im schlechtesten zurückgehaltenen Fall klar überlegen gegenüber DM_RAZOR.

Abb. R6 | LOO: Log-Likelihood-Verteilung für den zurückgehaltenen Bin (aus Run-9-Produkten).


6.6 Negativkontrolle: RC-bin-Shuffle (Run-10)

Run-10 gruppiert die 20 RC-Bins zufällig neu in 4×5 und berechnet Closure erneut, wobei der RC-only-Posterior unverändert bleibt. Die Ergebnisse zeigen, dass das Shuffling im Vergleich zur ursprünglichen Zuordnung sowohl die mittlere Closure-LogL_true als auch ΔlogL_closure deutlich senkt (siehe Tabelle S1b und Abb. R1), was die Interpretierbarkeit des Closure-Signals weiter stützt.

Abb. R7 | Negativkontrolle: Die Shuffle-Zuordnung verursacht einen klaren Rückgang der mittleren Closure-logL_true (aus Run-10-Produkten).

7 Rückverfolgbarkeit und Konsistenzaudit (Provenance)

Alle in dieser Arbeit zitierten Zahlenwerte können Punkt für Punkt in den strengen Zusammenfassungstabellen und Audit-Aufzeichnungen des Release-Archivs zurückverfolgt werden. Um den Haupttext lesbarer zu halten, wurde die vollständige Provenance-Kette (Tag-Liste, Audit-Tabellen, Prüfsummenliste und Verifikationsmethode) in Anhang A verschoben.

8 Reproduzierbarkeit und Zenodo-Archiv

Erklärung zur Verfügbarkeit von Daten und Code: Die in dieser Arbeit verwendeten SPARC-Rotationskurvendaten und KiDS-1000-Daten zur schwachen Linsenwirkung sind öffentliche Datensätze. Der publikationsreife Bericht wurde auf Zenodo archiviert (Concept DOI: https://doi.org/10.5281/zenodo.18526334), und das vollständige Reproduktionspaket wurde auf Zenodo archiviert (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Detaillierte Ausführungsschritte, Abhängigkeitsumgebung, Archivinventar und Hash-Verifikationsinformationen sind in Anhang A angegeben; Design, Run-Tags und Outputs des Stresstests zur Standardisierung der DM-Basislinie (P1A) sind in Anhang B angegeben.

Unter derselben Concept DOI des vollständigen Reproduktionspakets (https://doi.org/10.5281/zenodo.18526286) stellen wir zwei reproduzierbare Einstiegspunkte nach Anwendungsfall bereit: • P1 (Haupttext) full_fit_runpack: reproduziert die RC-only-/Closure-/gemeinsamen Analysen und Robustheits-Scans für EFT vs. DM_RAZOR und erzeugt Haupttext-Artefakte einschließlich Tabellen S1a/S1b und Abbildungen S3/S4; • P1A (Anhang B) full_fit_runpack: reproduziert den Stresstest zur Standardisierung der DM-Basislinie (SCAT/AC/FB + hierarchischer c–M-Streuungsprior + core1p + Lensing m + DM_STD, einschließlich der EFT_BIN-Kontrolle) und erzeugt Anhangstabelle B1 und Abb. B1. Die ergänzenden Tabellen/Abbildungen und das full_fit_runpack von P1A werden als zusätzliche Dateien unter derselben Concept DOI aufgenommen, um einen einzigen Archiveinstiegspunkt zu erhalten.

9 Danksagungen und Erklärungen


9.1 Danksagungen

Wir danken den SPARC- und KiDS-1000-Teams für die Bereitstellung öffentlicher Daten und Dokumentation sowie den Beteiligten am Rekonstruktions- und Audit-Workflow dieses Projekts.


9.2 Autorenbeiträge

Guanglin Tu war verantwortlich für den konzeptionellen Vorschlag, das Studiendesign, die technische Implementierung, die Datenkuratierung, die formale Analyse, die Implementierung und Auditierung des Reproduzierbarkeitsworkflows sowie das Schreiben des Manuskripts.


9.3 Finanzierung

Eigenfinanziert durch den Autor Guanglin Tu (keine externe Finanzierung / keine Fördernummer).


9.4 Interessenkonflikte

Der Autor Guanglin Tu ist mit der „EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)“ affiliiert; es werden keine weiteren Interessenkonflikte erklärt.


9.5 KI-Unterstützung

OpenAI GPT-5.2 Pro und Gemini 3 Pro wurden für sprachliche Glättung, strukturelle Bearbeitung und Organisation des Reproduzierbarkeitsworkflows verwendet. Sie wurden nicht zur Erzeugung oder Änderung von Daten, Ergebnissen, Abbildungen, Tabellen oder Code und auch nicht zur Erzeugung von Zitaten eingesetzt. Der Autor trägt die volle Verantwortung für den Inhalt und die Zitiergenauigkeit des gesamten Manuskripts.

10 Literaturverzeichnis

Anhang A: Details zu Rückverfolgbarkeit und Reproduzierbarkeit

Dieser Anhang fasst Langzeitarchivinformationen für Rückverfolgbarkeit und Reproduzierbarkeit zusammen, einschließlich Run-Tags, Audit-Ergebnissen, Archivinventaren und zentralen Verifikationspunkten, damit Leserinnen und Leser die Arbeit bei Bedarf prüfen und reproduzieren können.


A.1 Details zu Rückverfolgbarkeit und Audit

Um langfristige Rückverfolgbarkeit zu gewährleisten, verwendet dieses Projekt zeitgestempelte Tags für jeden Run und jeden Output und bewahrt historische Produkte ohne Überschreiben auf. Die in diesem Manuskript zitierten Kernwerte stammen aus der strengen Kompilierung (compile_tag=20260205_035929) und haben die folgenden Konsistenzaudits bestanden:

• Alle Stage-Level-Tabellen tragen run_tag und Stage-Tags; das strenge Kompilierungsskript wählt „vollständige und konsistente“ kanonische Tabellenquellen aus report/tables aus.

• Werte in Tab_Z1_master_summary und Tab_Z2_conclusion_highlights werden Punkt für Punkt mit den ausgewählten kanonischen Tabellen verglichen.

• Während der PDF-Erzeugung wird ein Tag-Audit der „referenzierten Tabellen-/Abbildungs-Tags“ durchgeführt, um sicherzustellen, dass keine veralteten Produkte beigemischt werden.

Schlüssel-Tags (zum Auffinden aller Zwischenprodukte): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Ergebnis des Konsistenzaudits: Tab_AUDIT_checks_strict berichtet pass=9, fail=0, skip=0 (Details siehe Release-Paket).


A.2 Ausführungsschritte zur Reproduzierbarkeit und Archivinventar

Diese Studie verwendet ein Reproduzierbarkeitssystem aus „publikationsreifem Bericht + Tabellen-/Abbildungs-Supplement + vollständig erneut ausführbarem Run-Paket“. Leserinnen und Leser können das Tables & Figures Supplement direkt konsultieren, um alle im Paper zitierten Tabellen-/Abbildungs-Artefakte zu überprüfen; um Zahlenwerte und Audit-Kette von Grund auf zu reproduzieren, können sie das full_fit_runpack nutzen, um die Daten herunterzuladen und den vollständigen Workflow erneut auszuführen. Nach Abschluss kann das eingebaute Referenztabellen-Vergleichsskript des Pakets verwendet werden, um die Konsistenz der Tabellenwerte zu überprüfen.


A.2.1 Reproduktions-Schnellstart (RUN_FULL, Windows PowerShell)

Dieser Abschnitt gibt einen kürzeren Reproduktionspfad (Windows PowerShell) an. Für Schnellprüfungen wird empfohlen, direkt das Tables & Figures Supplement zu konsultieren und die zitierten Tabellen und Abbildungen Punkt für Punkt zu prüfen. Für End-to-End-Reproduktion und Erzeugung aller Tabellen, Abbildungen und Audit-Produkte sollte das full_fit_runpack verwendet werden: Folgen Sie dem Paket README/ONE_PAGE_REPRO_CHECKLIST, um verify_checksums.ps1 und RUN_FULL.ps1 auszuführen (Mode=full empfohlen).

Zenodo-Archiveintrag (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Main-chain-Tags für diese Arbeit: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.


A.2.2 Archivmaterialien und zentrale Verifikationspunkte (Pakete & Prüfungen)

Das Zenodo-Archiv stellt drei komplementäre Materialkategorien bereit: (1) publikationsreifer Bericht (diese Arbeit, v1.1; einschließlich Anhang B: P1A-Stresstest zur Standardisierung der DM-Basislinie); (2) Tables & Figures Supplement (ergänzende Tabellen und Abbildungen, die alle in dieser Arbeit zitierten Tabellen-/Abbildungs-Artefakte abdecken, getrennt für P1 und P1A); und (3) full_fit_runpack (vollständiges Reproduktionspaket: lädt Daten von Grund auf herunter und führt den vollständigen Workflow erneut aus, getrennt für P1 und P1A). Die Punkte (1)–(2) unterstützen schnelle Lektüre und unabhängige Verifikation; Punkt (3) bietet vollständige End-to-End-Reproduzierbarkeit.

Materialkategorie

Dateiname (Beispiel)

Zweck und Einordnung (empfohlene Nutzungsreihenfolge)

Publikationsreifer Bericht (Chinesisch und Englisch)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf / P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Vollständiger auf Zenodo archivierter Bericht; der Haupttext gibt die Kernschlussfolgerungen und Robustheitsaudits, und Anhang B enthält P1A (Stresstest zur Standardisierung der DM-Basislinie).

Tabellen- & Abbildungs-Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Alle im Haupttext zitierten Tabellen (CSV) und Abbildungen (PNG), einschließlich Generierungsskripten und Tag-Dateien.

Tabellen- & Abbildungs-Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Alle in Anhang B (P1A) zitierten Tabellen und Abbildungen, einschließlich Tab_S1_P1A_scoreboard und Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

End-to-End-Vollreproduktion: Daten von Grund auf herunterladen und RC-only/Closure/Gemeinsam sowie Robustheits-Scans erneut ausführen.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

End-to-End-Vollreproduktion (Anhang B): DM 7+1 + DM_STD erneut ausführen (einschließlich der EFT_BIN-Kontrolle) und Anhangsassets erzeugen; das Paket enthält ein Referenztabellen-Vergleichsskript zur Überprüfung der Konsistenz von Tabellenwerten.

Zitierempfehlung: Wenn diese Arbeit oder die zugehörigen Reproduzierbarkeitsmaterialien zitiert werden, zitieren Sie bitte die Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

Schlüsselprodukte, die nach der Reproduktion erscheinen und vergleichbar sein sollten, umfassen:

Anhang B: P1A — Stresstest zur Standardisierung der DM-Basislinie (DM 7+1 + DM_STD; mit EFT-Kontrolle)

Dieser Anhang dokumentiert ein Erweiterungsprojekt (P1A) zum „Stresstest zur Standardisierung der DM-Basislinie“, das mit dem Closure-Protokoll des Haupttexts konsistent ist. Seine Aufgabe ist es, die im Haupttext verwendete minimale DM_RAZOR-Basislinie (NFW + feste c–M, keine Streuung / keine Kontraktion / kein Core) zu einem Satz von DM-Basislinien aufzurüsten, der näher an der astrophysikalischen Praxis liegt und verbreiteten Einwänden besser standhält, ohne viele Freiheitsgrade einzuführen und ohne die gemeinsame RC-bin→GGL-bin-Zuordnung oder den Audit-Rahmen zu ändern. P1A deckt den früheren dreizweigigen Stresstest ab und erweitert ihn: Es behält SCAT/AC/FB bei, fügt aber hierarchische c–M-Streuung + Prior, einen Ein-Parameter-Core-Proxy und eine Lensing-seitige Scherkalibrierungs-Nuisance m hinzu; außerdem stellt es das kombinierte Modell DM_STD bereit. EFT_BIN bleibt als Kontrollreferenz erhalten.

Ergänzende Anmerkung: Closure-Stärken und verwandte Werte in Anhang B (P1A) verwenden ein größeres Monte-Carlo-Budget (z. B. ndraw=400, nperm=24) als das schnelle Budget im Haupttext zur Abdeckung der vollständigen EFT-Kernfamilie (z. B. ndraw=60, nperm=12). Daher können Absolutwerte eine Sampling-Drift der Größenordnung O(10) zeigen. Modell-zu-Modell-Vergleiche innerhalb desselben Budgets/derselben Tabelle sind jedoch fair, und Vorzeichen sowie Größenordnung des Vorteils bleiben über Budgets hinweg stabil.


B.1 Zweck und Einordnung (Warum P1A, und warum als Anhang)

P1A versucht nicht, alle möglichen ΛCDM-Halomodellierungsentscheidungen auszuschöpfen (etwa Nicht-Sphärizität, Umweltabhängigkeit, komplexe Galaxie-Halo-Verbindungen oder hochdimensionale Baryonenphysik). Stattdessen folgt P1A dem Prinzip „niedrigdimensional, auditierbar, reproduzierbar“: Jedes Erweiterungsmodul führt nur ≤1 zentralen effektiven Parameter ein und bleibt den drei harten Beschränkungen dieser Arbeit unterworfen:
(i) Parameter-Ledger: Jeder neue Parameter muss explizit aufgezeichnet und zusammen mit Informationskriterien (AICc/BIC) berichtet werden;
(ii) Gemeinsame Zuordnung: Dieselbe RC-bin→GGL-bin-Gruppierungskarte wird weiterhin verwendet; ein separates „Tuning der Zuordnung“ für einen einzelnen Datensatz ist nicht erlaubt;
(iii) Closure-Test: Jede Erweiterung muss einen echten Gewinn in der RC→GGL-Transfer-Vorhersage zeigen, nicht bloß eine bessere RC-only-Anpassung.


B.2 DM 7+1 + DM_STD: Moduldefinitionen, Parameter und Eintritt in den gemeinsamen Posterior

Als unabhängiger Runpack stellt P1A 8 DM-Workspaces (DM 7+1) plus 1 EFT-Kontrolle bereit: Ausgehend von DM_RAZOR als Basislinie konstruiert es drei ältere Ein-Parameter-Erweiterungen (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), fügt drei standardnähere defensive Module hinzu (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) und stellt anschließend das kombinierte Modell DM_STD bereit. Das gemeinsame Ziel dieser Module ist, die drei häufigsten Kritikklassen abzudecken und zugleich die Dimensionalität so gering wie möglich zu erhöhen: (a) wie c–M-Streuung und Priors in ein hierarchisches Modell eingehen; (b) ob der Haupteffekt baryonischen Feedbacks durch einen Ein-Parameter-Core-Proxy erfasst werden kann; und (c) ob zentrale Lensing-seitige Systematiken mit einem physikalischen Signal verwechselt werden könnten.

Workspace

dm_model

Neue(r) Parameter (≤1)

Physikalische Motivation (Kern)

Implementierungsprinzip (auditfreundlich)

DM_RAZOR

NFW (feste c–M, keine Streuung)

Minimale, auditierbare ΛCDM-Halo-Basislinie; für den strengen Vergleich mit EFT verwendet

Gemeinsame Zuordnung fixiert; strenger Parameter-Ledger; nur als Basislinie für relativen Vergleich verwendet

DM_RAZOR_SCAT

NFW + c–M-Streuung (legacy)

σ_logc

Die c–M-Relation besitzt Streuung; approximiert mit einer einparametrigen lognormalen Streuung

≤1 neuer Parameter; gemeinsame Zuordnung beibehalten; Closure-Gewinn als Akzeptanzkriterium verwendet

DM_RAZOR_AC

NFW + adiabatische Kontraktion (legacy)

α_AC

Baryonischer Einfall kann eine adiabatische Kontraktion des Halos auslösen; approximiert mit einer einparametrigen Stärke

≤1 neuer Parameter; Zuordnung unverändert; AICc/BIC-Änderungen und Closure-Gewinn werden berichtet

DM_RAZOR_FB

NFW + Feedback-Core (legacy)

log r_core

Feedback kann im inneren Bereich einen Core bilden; approximiert mit einer einparametrigen Core-Skala

≤1 neuer Parameter; dasselbe Closure-/Negativkontrollprotokoll; RC-only-Verbesserung ist nicht das alleinige Ziel

DM_HIER_CMSCAT

Hierarchische c–M-Streuung + Prior

σ_logc (hier)

Standardnähere hierarchische Form c_i∼logN(c(M_i),σ_logc); beeinflusst den gemeinsamen Posterior von RC und GGL

Expliziter Prior; latente c_i marginalisiert; weiterhin niedrigdimensional und auditierbar

DM_CORE1P

1-Parameter-Core-Proxy (coreNFW/DC14-inspiriert)

log r_core

Verwendet einen Ein-Parameter-Core-Proxy für den Haupteffekt baryonischen Feedbacks und vermeidet hochdimensionale Details der Sternentstehung

Zitiert Standardliteratur; ≤1 neuer Parameter; an den Closure-Test gekoppelt

DM_RAZOR_M

NFW + Nuisance für Lensing-Scherkalibrierung

m_shear (GGL)

Absorbiert eine zentrale schwache-Linsen-Systematik als effektiven Parameter und verringert das Risiko, Systematik mit Physik zu verwechseln

Nuisance explizit aufgezeichnet; kann RC nicht rückwirkend beeinflussen; Ergebnisse werden hauptsächlich nach Closure-Robustheit beurteilt

DM_STD

Standardisierte DM-Basislinie (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Enthält die drei häufigsten Kritikklassen in einer weiterhin niedrigdimensionalen Standardbasislinie

Parameter-Ledger + Informationskriterien berichtet; Closure ist die Primärmetrik; als stärkste defensive DM-Kontrolle verwendet

Hinweis: Die oben genannten Parameternamen folgen der Engineering-Implementierung (zum Beispiel σ_logc, α_AC, log r_core und m_shear). Der Designfokus von P1A besteht darin, „die DM-Basislinie etwas stärker zu machen und sie dabei auditierbar zu halten“, nicht darin, die DM-Seite in einen unkontrollierbaren hochdimensionalen Fitter zu verwandeln. Insbesondere führt DM_HIER_CMSCAT c–M-Streuung hierarchisch ein: Die Konzentration c_i jedes Halos erhält eine lognormale Streuung um c(M_i), beschränkt durch das globale σ_logc und den c(M)-Prior; diese hierarchische Struktur beeinflusst den gemeinsamen Posterior von RC und GGL.


B.3 Statistisches Protokoll und Produktkonventionen konsistent mit dem Haupttext

P1A verwendet alle Datenprodukte, die gemeinsame Zuordnung und den Audit-Rahmen des Haupttexts erneut. Ausführungsreihenfolge und Produktkonventionen bleiben konsistent:
(1) Run‑1: RC-only-Inferenz (gibt posterior_samples.npz und metrics.json aus);
(2) Run‑2: RC→GGL-Closure-Test (gibt closure_summary.json und die permutierte Basislinie aus);
(3) Run‑3: gemeinsame RC+GGL-Anpassung (gibt joint_summary.json aus).
Alle zitierten Zahlen stammen aus der automatisch kompilierten Tabelle (Tab_S1_P1A_scoreboard) und können nach erneuter Ausführung des vollständigen P1A-Workflows mit dem Referenztabellen-Vergleichsskript überprüft werden, das in das P1A full_fit_runpack eingebaut ist.


B.4 Hauptergebnisse, Tabellen-/Abbildungs-Einstiegspunkte und Archivplan (dieselbe DOI)

Dieser Abschnitt gibt die zentralen quantitativen Schlussfolgerungen von P1A. Tabelle B1 fasst Schlüsselmetriken für RC-only, RC→GGL-Closure und gemeinsame RC+GGL-Anpassung zusammen (Klammern geben Differenzen relativ zur DM_RAZOR-Basislinie an). Die Closure-Stärke ist definiert als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (höher ist besser). Abb. B1 visualisiert dasselbe Scoreboard. Die Hauptpunkte lauten wie folgt:
• Unter den drei älteren Zweigen liefert nur DM_RAZOR_FB (Feedback/Core) eine kleine Nettoverbesserung der Closure-Stärke: 122.21→129.45 (+7.25); SCAT und AC liefern keine Nettoverbesserung;
• Die neu hinzugefügten DM_HIER_CMSCAT und DM_RAZOR_M haben sehr kleine Effekte (~0) auf die Closure-Stärke, und DM_CORE1P zeigt ebenfalls keine signifikante Nettoverbesserung;
• Das kombinierte Modell DM_STD kann die gemeinsame logL deutlich verbessern (näher an das Optimum der gemeinsamen Anpassung), aber seine Closure-Stärke sinkt, was darauf hindeutet, dass sein Gewinn vor allem aus Flexibilität der gemeinsamen Anpassung und nicht aus datenübergreifender Übertragbarkeit stammt;
• Als Kontrolle behält EFT_BIN sowohl in der Closure-Stärke als auch in der gemeinsamen Anpassung einen klaren Vorteil. Daher ist die Hauptschlussfolgerung robust gegenüber der Einführung einer „stärkeren DM-Basislinie + Lensing-Nuisance“.

Für den direkten Vergleich mit den Ergebnissen des Haupttexts fassen Tabellen S1a–S1b den strengen Vergleich zwischen der EFT-Familie und DM_RAZOR zusammen: EFT-Modelle verbessern die gemeinsame Anpassung um ΔlogL_total≈1155–1337 relativ zu DM_RAZOR und erreichen im Closure-Test ΔlogL_closure=172–281. P1A schafft lediglich eine „härtere Kontrolle“ auf der DM-Seite; sein Zweck ist, Bedenken wie „Strohmann-Basislinie“ oder „Systematik-als-Physik“ zu verringern, nicht den Hauptvergleich zu ersetzen.

Tabelle B1 | P1A-Scoreboard (höher ist besser; Klammern geben Differenzen relativ zur DM_RAZOR-Basislinie an).

Modellzweig (Workspace)

Δk

RC-only best logL_RC (Δ)

Closure-Stärke ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Abb. B1 | P1A-Scoreboard: Closure und gemeinsames ΔlogL relativ zur Basislinie (höher ist besser).

Beispiel-Tags für den abgeschlossenen Run-Satz, der diesem Anhang entspricht, lauten wie folgt (zur Lokalisierung von P1A-Zwischenprodukten und Tabellen/Abbildungen):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Empfohlene Zitierung (Hinweis zur Anhangszitierung)

Wenn Leserinnen und Leser den „Stresstest zur Standardisierung der DM-Basislinie“ zusätzlich zu den Hauptschlussfolgerungen der Arbeit zitieren müssen, wird empfohlen, die Hauptschlussfolgerung zusammen mit folgendem Hinweis zu zitieren: „Siehe Anhang B (P1A) für standardisierte Stresstests der DM-Basislinie (legacy SCAT/AC/FB + hierarchischer c–M-Streuungsprior + Core-Proxy + Lensing-Scherkalibrierungs-Nuisance) unter demselben Closure-Protokoll.“