← Experiment

Rahmen mittlerer Gravitation der Energie-Filament-Theorie (Energy Filament Theory, EFT) im Vergleich zur minimalen NFW-Basislinie für kalte Dunkle Materie (DM)

Autor: Guanglin Tu
E-Mail: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
Institution: EFT-Arbeitsgruppe, Shenzhen Energy Filament Science Research Co., Ltd. (China)
Version: v1.1 | Datum: 2026-02-14

Preprint (nicht peer-reviewed) | Diese Fassung dient der öffentlichen Verbreitung und der Reproduzierbarkeit; sie entspricht nicht notwendigerweise einer endgültigen Zeitschriftenfassung.

Lizenz: Bericht (CC BY-NC-ND 4.0); vollständiges Reproduktionspaket (CC BY 4.0).

Veröffentlichungsreifer Bericht (Concept DOI): https://doi.org/10.5281/zenodo.18526334
Vollständiges Reproduktionspaket (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 Executive Summary

Dieser Bericht ist eine bei Zenodo archivierte vollständige Berichtsfassung (Archivfassung). Er stellt eine durchgehend auditierbare Kette von Daten, Modellbuchführung, fairem Vergleich, Closure-Test und Reproduktionsmaterial bereit. Anhang B (P1A) ergänzt dies um Robustheitsprüfungen mit einer „standardisierteren DM-Basislinie + zentraler Linsen-Systematik“, um zu prüfen, wie empfindlich die Hauptaussagen gegenüber realistischeren DM-Modellen und Linsen-Systematiken sind.

Kernaussagen (vier Sätze, direkt zitierbar; siehe Abschnitt 2.4):

(1) Bei der Anpassung der Rotationskurven (RC) ist die EFT-Familie unter allen Kernfunktionen und Prior-Kombinationen deutlich besser als DM_RAZOR; die typische Verbesserung beträgt Δlog𝓛_RC ≈ 10^3 (siehe Tabelle S1a).
(2) Im RC→GGL-Closure-Test zeigt EFT eine stärkere Übertragbarkeit zwischen den Sonden: Die Closure-Stärke Δlog𝓛_closure (True−Perm) liegt klar über DM_RAZOR, und der Unterschied bleibt gegenüber covariance shrinkage, R_min und σ_int-Scans robust (siehe Abb. S3, Tabelle S1b).
(3) In der gemeinsamen Anpassung (RC+GGL) behält EFT seinen stabilen Vorteil; in der Negativkontrolle, in der die gemeinsame Zuordnung zerstört wird, bricht dieser Vorteil ein. Das spricht dafür, dass der „mittlere Gravitationseffekt“ aus der gemeinsamen Zuordnung stammt und nicht aus zufälliger Überanpassung (siehe Abb. S4).
(4) Anhang B (P1A) stresstestet die DM-Seite mit standardisierteren DM-Basislinienmodulen und einem wichtigen lensing nuisance, ohne die Dimensionen wesentlich zu erhöhen; diese Erweiterungen beseitigen den Closure-Vorteil von EFT nicht (siehe Tabelle B1, Abb. B1).

Verfügbarkeit von Daten und Code: Bericht Concept DOI 10.5281/zenodo.18526334; vollständiges Reproduktionspaket Concept DOI 10.5281/zenodo.18526286. Die zu Anhang B (P1A) gehörenden Tags lauten run_tag=20260213_151233, closure_tag=20260213_161731, joint_tag=20260213_195428.

1 Abstract

Wir vergleichen zwei theoretische Rahmen auf denselben Daten und unter demselben statistischen Protokoll quantitativ und reproduzierbar: das von der Energie-Filament-Theorie (Energy Filament Theory, EFT; nicht zu verwechseln mit der üblichen Abkürzung für Effective Field Theory) vorgeschlagene Modell einer „mittleren Gravitationskorrektur“ und ein NFW-Halo-Basismodell für kalte Dunkle Materie (DM_RAZOR). DM_RAZOR wird bewusst als minimale DM-Basislinie gewählt: NFW-Halo + feste c–M-Beziehung ohne halo-to-halo scatter. Zugleich behandeln wir EFT hier als phänomenologische, MOND-ähnliche Parametrisierung eines effektiven Feldes bzw. einer effektiven Antwort, nicht als in diesem Artikel aus ersten mikrophysikalischen Prinzipien hergeleitete Theorie. [Effektives Feld]

Die Daten umfassen 2295 Geschwindigkeitsdatenpunkte aus einheitlich vorverarbeiteten und gebinnten SPARC-Rotationskurven (104 Galaxien, 20 RC-Bins) sowie die äquivalente Flächendichte ΔΣ(R) aus KiDS-1000-Galaxie-Galaxie-Lensing (4 Sternmassen-Bins × 15 R-Punkte pro Bin, insgesamt 60 Punkte, mit vollständiger Kovarianz).

Wir führen der Reihe nach RC-only-Inferenz, RC→GGL-Closure, GGL-only-Inferenz und gemeinsame RC+GGL-Inferenz aus; Konsistenz-Audits stellen sicher, dass alle zitierten Werte rückverfolgbar sind. Unter strenger Parameterbuchführung und gemeinsamer Zuordnung (DM: 20 log M200_bin; EFT: 20 log V0_bin + 1 globales log ℓ) ist die EFT-Familie in der gemeinsamen Anpassung DM_RAZOR deutlich überlegen: ΔlogL_total = 1155–1337 relativ zu DM_RAZOR. Entscheidend ist außerdem: Die RC-Posterior-Verteilung besitzt nichttriviale Vorhersagekraft für GGL; EFT erreicht ΔlogL_closure = 172–281, DM_RAZOR 127. Wird die RC-bin→GGL-bin-Gruppierung zufällig permutiert, fällt das Closure-Signal auf 6–23. Das spricht gegen Zufall oder Implementierungsartefakte. Systematische Scans über σ_int, R_min und covariance shrinkage ändern Vorzeichen und Größenordnung des EFT-Vorteils nicht. Anhang B (P1A) prüft mit einer standardisierteren, aber weiter niedrigdimensionalen und auditierbaren DM-Basislinie, ob diese Schlussfolgerung von einer zu schwachen DM-Seite abhängt; sie tut es nicht (siehe Tabelle B1/Abb. B1).

Schlüsselwörter: Rotationskurven; Galaxie-Galaxie-Lensing; Closure-Test; EFT; kalte Dunkle Materie; Bayes’sche Inferenz

2 Einleitung und Ergebnisüberblick

Rotationskurven (RC) und Galaxie-Galaxie-Lensing (GGL) sind komplementäre Gravitationssonden: RC begrenzt das dynamische Potenzial in der Scheibenebene und die radiale Beschleunigungsrelation (RAR), während GGL die projizierte Massenverteilung und die Gravitationsantwort auf Halo-Skalen misst. Für eine Kandidatentheorie ist nicht entscheidend, ob sie beide Datensätze getrennt fitten kann, sondern ob sie beide innerhalb derselben datenübergreifenden Zuordnung und gemeinsamer Einschränkungen konsistent erklärt.

Daher verwenden wir den Closure-Test als zentrales statistisches Protokoll: Aus der RC-only-Posterior-Verteilung wird GGL vorwärts vorhergesagt und anschließend mit einer Negativkontrolle verglichen, in der die RC-bin→GGL-bin-Zuordnung permutiert bzw. geshuffelt wird. So wird die Vorhersage-Übertragbarkeit zwischen Datensätzen bewertet und ein Pseudosignal durch Implementierungsbias oder Zufallsfit ausgeschlossen.

Theoretische Einordnung und Umfang: Dieser Artikel versucht nicht, eine mikrophysikalische Erste-Prinzipien-Herleitung oder eine relativistisch vollständige Form der EFT zu liefern. Stattdessen nutzen wir EFT als niedrigdimensionale, MOND-ähnliche Parametrisierung einer effektiven Antwort, beschrieben durch eine Kernfunktion f(x) und eine globale Skala ℓ, und testen ihre datenübergreifende Konsistenz im RC→GGL-Closure-Test unter strenger Parameterbuchführung.

Forschungsprogramm und Umfang: Dieser Beitrag gehört zu einem fortlaufenden P-Serien-Programm zur beobachtungsbasierte Auswertung. In vorhandenen Galaxienskalen-Daten suchen wir nach zwei möglichen effektiven Hintergrundbeiträgen: (i) einem „Gravitationsboden“, der als grob gemittelte Gravitationsantwort beschrieben werden kann, und (ii) einem „Rauschboden“, der mit Fluktuationen mikroskopischer Prozesse zusammenhängt. In diesem P1-Beitrag betrachten wir nur den ersten Fall. Ohne Annahmen über einen mikroskopischen Erzeugungsmechanismus suchen wir im RC→GGL-Closure-Test nach Beobachtungsspuren eines mittleren Gravitationsbodens und vergleichen ihn mit einer auditierbaren DM-Basislinie. Als heuristisches Bild könnten kurzlebige Freiheitsgrade beim Zerfall oder bei der Annihilation Ruhemasse in Energie-Impuls anderer Freiheitsgrade überführen; auf effektiver Ebene entspricht das einer Zerlegung in Mittelwertbeitrag und Fluktuationsbeitrag. Dieses Bild wird hier jedoch nicht quantitativ modelliert.

Zur Vermeidung von Überinterpretationen gilt für diesen Artikel:
• Was er tut: Er misst unter strenger Parameterbuchführung und gemeinsamer Zuordnung die Vorhersage-Übertragbarkeit zwischen Datensätzen und vergleicht EFTs mittlere Gravitationsantwort reproduzierbar mit einer DM-Basislinie.
• Was er nicht tut: Er diskutiert keine mikroskopischen Erzeugungsmechanismen, Häufigkeiten, Lebensdauern oder kosmologischen Einschränkungen; der zum „Rauschboden“ gehörende Zufallsterm wird nicht modelliert.
• Was er nicht behauptet: Ziel ist nicht, Dunkle Materie zu widerlegen. P1 fällt kein Endurteil über die Existenz des Bodens, sondern berichtet vorläufige Evidenz: Im hier gewählten robusten Messbereich bevorzugen die Daten Modelle mit einer mittleren Gravitationsantwort.

Zugleich stellen wir klar, dass DM_RAZOR nur eine minimierte, auditierbare NFW-Basislinie darstellt (feste c–M-Beziehung, kein scatter, keine adiabatische Kontraktion, kein Feedback-Core, keine nicht-sphärischen oder Umwelteffekte). Die Hauptaussage ist daher strikt begrenzt: Unter dieser minimalen Basislinie und unter strenger Parameter-/Zuordnungsbuchführung ist die datenübergreifende Konsistenz von EFT stärker. Die Frage, ob eine standardisiertere ΛCDM-Basislinie und zentrale Linsen-Systematiken das Ergebnis verändern, beantworten wir in Anhang B (P1A) mit standardisierteren, aber niedrigdimensionalen und auditierbaren DM-Erweiterungen bei identischem Closure-Protokoll (siehe Tabelle B1/Abb. B1).

2.1 Tab S1a–S1b: Zusammenfassung der Schlüsselmetriken (Strict)

Tabelle S1a zeigt die Hauptvergleichsmetriken der gemeinsamen Anpassung (RC+GGL: logL, ΔlogL, AICc, BIC). Tabelle S1b zeigt Closure- und Robustheitsmetriken (closure, shuffle-Negativkontrolle, σ_int-/R_min-/cov-shrink-Scanbereiche). Alle Zahlen stammen aus der strengen Haupttabelle Tab_Z1_master_summary und sind im Release-Archiv einzeln nachvollziehbar.

Tabelle S1a | Hauptvergleichsmetriken der gemeinsamen Anpassung (RC+GGL, Strict).

Modell (workspace)

W-Kern

k

gemeinsames logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Tabelle S1b | Closure- und Robustheitsmetriken (Strict).

Modell (workspace)

Closure ΔlogL (true-perm)

ΔlogL nach Negativkontrolle shuffle

ΔlogL-Bereich im σ_int-Scan

ΔlogL-Bereich im R_min-Scan

ΔlogL-Bereich im cov-shrink-Scan

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: Closure-Stärke (RC-only → vorhergesagtes GGL)

Die Closure-Stärke ist definiert als ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: GGL wird aus RC-only-Posterior-Samples vorwärts vorhergesagt und mit der Negativkontrolle einer permutierten RC-bin→GGL-bin-Zuordnung verglichen.

Abb. S3 | Closure-Stärke (größer ist besser): mittlerer Log-Likelihood-Vorteil der RC-only → GGL-Vorhersage.


2.3 Fig S4: Hauptvergleich der gemeinsamen Anpassung (RC+GGL)

Der Vorteil der gemeinsamen Anpassung ist ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). Bei denselben Daten, derselben Zuordnung und nahezu gleicher Parameterzahl erreicht die EFT-Familie deutlich höhere gemeinsame Log-Likelihoods.

Abb. S4 | Vorteil der gemeinsamen Anpassung (größer ist besser): best logL_total von RC+GGL relativ zu DM_RAZOR.


2.4 Vier Schlussfolgerungen (direkt zitierbar)

(1) In der einheitlichen gemeinsamen Analyse von SPARC-Rotationskurven und KiDS-1000-Schwachlinsen ist das EFT-Modell der mittleren Gravitation unter dem strengen Vergleichsprotokoll systematisch besser als DM_RAZOR: ΔlogL_total = 1155–1337 relativ zu DM_RAZOR.

(2) Der RC→GGL-Closure-Test zeigt eine stärkere Vorhersagekonsistenz von EFT: ΔlogL_closure = 172–281, gegenüber 127 für DM_RAZOR. Wird die RC-bin→GGL-bin-Zuordnung zufällig geshuffelt, bricht das Closure-Signal auf 6–23 ein; es hängt also an der korrekten datenübergreifenden Zuordnung und nicht an Zufallsfit.

(3) Systematische Scans über σ_int, R_min und covariance shrinkage ändern weder Vorzeichen noch Größenordnung des Befunds „EFT besser als DM_RAZOR“; die Aussage ist gegenüber typischen Systemstörungen robust.

(4) Anhang B (P1A) verstärkt die DM-Basislinie im selben Closure-Protokoll standardisiert und auditierbar: Drei Ein-Parameter-Erweiterungen (SCAT/AC/FB) bleiben erhalten, zusätzlich werden hierarchischer c–M scatter + prior, ein Ein-Parameter-Core-Proxy und die Linsen-Scherkalibrierung m sowie DM_STD eingeführt. Nur der Feedback/Core-Zweig bringt eine kleine Nettoverbesserung der Closure-Stärke (122.21→129.45, ΔΔlogL_closure≈+7.25); die übrigen Erweiterungen sind gering oder negativ. Die Hauptaussage hängt daher nicht davon ab, dass DM_RAZOR zu schwach wäre.

3 Daten und Vorverarbeitung

Diese Studie nutzt zwei Klassen öffentlicher Daten und verarbeitet Download, Prüfsummen (sha256) und Vorverarbeitung mit rückverfolgbaren Skripten. Für einen fairen Vergleich teilen alle Arbeitsbereiche (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) dieselben Datenprodukte und dieselbe Bin-Zuordnung.


3.1 Rotationskurven (RC, SPARC)

Die RC-Daten stammen aus den Rotmod_LTG-Dateien der SPARC-Datenbank (175 rotmod-Dateien). Nach der Vorverarbeitung umfasst die modellierte Stichprobe 104 Galaxien mit 2295 Datenpunkten (r, V_obs), aufgeteilt in 20 RC-Bins nach Sternmasse und verwandten Regeln. Jeder Punkt enthält Radius r (kpc), beobachtete Geschwindigkeit V_obs (km/s), Fehler σ_obs sowie Gas-, Scheiben- und Bulge-Komponenten (V_gas, V_disk, V_bul).


3.2 Schwache Linsenwirkung (GGL, KiDS-1000 / Brouwer+2021)

Für GGL verwenden wir die von Brouwer et al. (2021) für KiDS-1000 angegebene äquivalente Flächendichte ΔΣ(R) aus Fig. 3 (4 Sternmassen-Bins, je 15 R-Punkte) samt vollständiger Kovarianz. Die long-form-Kovarianz wird pro Bin zu einer 15×15-Matrix rekonstruiert; ein Stage-B-Audit prüft Dimensionen und numerische Plausibilität.


3.3 RC-bin → GGL-bin-Zuordnung und Gesamtstichprobe

Die 4 GGL-Massen-Bins werden über eine feste Zuordnung mit den 20 RC-Bins verbunden: Jeder GGL-Bin entspricht 5 RC-Bins; deren Beiträge werden mit Galaxienzahlen gewichtet. Diese Zuordnung bleibt in allen Modellen unverändert und bildet die zentrale Fairness-Bedingung von Closure-Test und gemeinsamer Anpassung. Insgesamt ergeben sich n_total = 2355 Datenpunkte (RC=2295, GGL=60).

4 Modelle und statistische Methode


4.1 Minimale mathematische Spezifikation von EFT und DM (auditierbar/testbar)

Dieser Abschnitt gibt die minimalen mathematischen Spezifikationen an, die direkt der Implementierung entsprechen.

(a) Rotationskurvenmodell (RC)

Für jeden RC-Datenpunkt (r, V_obs, σ_obs) verwenden wir die Komponentensumme V_mod²(r) = V_bar²(r) + V_extra²(r). Dabei gilt V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). In den Hauptergebnissen setzen wir Υ_d = Υ_b = 0.5, konsistent mit SPARC-Empfehlungen und zur Reduktion unnötiger Freiheitsgrade.

(b) EFT-Korrektur der mittleren Gravitation (EFT)

Der zusätzliche EFT-Term wird als mittlere Geschwindigkeitsquadratform parametrisiert: V_extra²(r) = V0_bin² · f(r/ℓ). V0_bin ist der Amplitudenparameter jedes RC-Bins (20 Parameter), ℓ eine globale Skala (1 Parameter), und f(x) ist eine dimensionslose Kernform. Die verglichenen Kernformen, ohne zusätzliche kontinuierliche Freiheitsgrade, sind:

Physikalische Motivation (erweitert): EFT versteht die zusätzliche Gravitationsantwort auf Galaxienskalen als effektive Antwort nach Grobkörnigung bzw. Skalenmittelung mikroskopischer Wirkungen auf endlichen Skalen. In diesem Artikel setzen wir keinen konkreten mikroskopischen Mechanismus voraus, sondern verwenden eine minimale, auditierbare Parametrisierung für kontrollierte Vergleiche im einheitlichen statistischen Protokoll.

Anschaulich kann der Zusatzterm als Beschleunigung geschrieben werden: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Für r≫ℓ gilt f→1 und V_extra→V0_bin, was außen einen näherungsweise flachen zusätzlichen Geschwindigkeitsbeitrag liefert. Für r≪ℓ und f(x)≈x ergibt sich eine charakteristische Beschleunigungsskala a0,bin≈V0_bin²/ℓ bis auf einen O(1)-Kernfaktor, also eine MOND-ähnliche Übergangsintuition.

Die diskrete Kernfamilie (none/exponential/yukawa/powerlaw_tail) dient als niedrigdimensionaler Proxy für unterschiedliche Anfangssteigungen, Übergangsgeschwindigkeiten und langreichweitige Tails, etwa Yukawa-artige Abschirmung versus längere Antwortschwänze. Sie ist ein Robustheits-Stresstest und keine Ausschöpfung des Modellraums. Für die Linsenwirkung konstruieren wir aus V_avg(r) eine effektive Hüllenmasse und -dichte und projizieren diese zu ΔΣ(R); diese effektive Dichte ist eine schwachfeldartige, sphärisch symmetrisierte Beschreibung des Linsenpotenzials (Details in Anhang A).

Alle Kernformen erfüllen für x→∞ die Sättigung f(x)→1, also V_extra²→V0². Für x≪1 zeigen sie lineares oder sublineares Wachstum: exponential f≈x, yukawa f≈0.5x, powerlaw_tail f≈0.5x. Dadurch unterscheiden sich Anfangssteigung, Übergang und äußerer Tail beobachtbar und können durch RC+GGL sowie Closure-Test unterschieden werden.

Die EFT-Vorhersage für ΔΣ(R) wird aus V_avg(r) über Hüllenmasse und Dichte zurückgerechnet und danach projiziert: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). Numerisch verwenden wir ein logarithmisches Gitter mit adaptiver Verdichtung bei Ausnahmen, um Stabilität und Reproduzierbarkeit zu sichern.

(c) DM_RAZOR: NFW-Basislinie für kalte Dunkle-Materie-Halos

DM_RAZOR ist nur eine minimierte, auditierbare NFW-Basislinie: feste c–M-Beziehung, kein scatter, keine adiabatische Kontraktion, kein Feedback-Core, keine nicht-sphärischen oder Umwelteffekte. Um das Risiko einer strawman baseline zu senken, behaupten wir nicht, diese Effekte existierten nicht; vielmehr werden sie in Anhang B (P1A) niedrigdimensional und auditierbar als Stresstests integriert, einschließlich hierarchischem c–M scatter, Core-Proxy und Linsen-Scherkalibrierung.


4.2 Modellbuchführung und fairer Vergleich (geteilte Parameter = Closure-Definition)

Die Hauptvergleichsmenge hat folgende Parameterzahlen: DM_RAZOR k=20; die EFT-Familie k=21 (der zusätzliche Parameter ist das globale log ℓ). Alle Modelle teilen dieselben RC-Daten, GGL-Daten, Kovarianzen, dieselbe RC-bin→GGL-bin-Zuordnung, dieselben baryonischen Terme und Einheitenumrechnungen. Die Kernformen (none / exponential / yukawa / powerlaw_tail) sind diskrete Wahlen ohne zusätzliche kontinuierliche Parameter; der Vorteil entsteht also nicht aus einem freien Mehrparameter.


4.3 Likelihood, Priors und Sampler

Die RC-Likelihood ist diagonal gaußförmig mit σ_eff² = σ_obs² + σ_int²; in den Hauptergebnissen ist σ_int=5 km/s fixiert und wird in Run-5 gescannt. Die GGL-Likelihood nutzt die vollständige Kovarianz pro Bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Das gemeinsame Ziel ist logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Priors sind vor allem physikalische Grenzen für log ℓ, log V0 und log M200; bei freiem Υ und σ_int werden schwach informative Priors verwendet.

Als Sampler verwenden wir einen adaptiven blockweisen Metropolis-Random-Walk: In jedem Schritt wird nur ein zufälliger Teilblock des Parameterraums aktualisiert, um die Akzeptanzrate in hoher Dimension zu verbessern; die Schrittweite wird leicht an die Fenster-Akzeptanzrate angepasst (Zielwert ca. 0.25). Die Hauptergebnisse nutzen einen quick-Modus (z. B. n_steps=800), und jeder Arbeitsbereich gibt Trace-, Residuen- und PPC-Diagramme für manuelle und Skript-Audits aus.


4.4 Closure-Test und Negativkontrolle (Definition)

Der Closure-Test (Run-2) prüft ohne erneute GGL-Anpassung, ob die RC-only-Posterior-Verteilung GGL vorhersagen kann. Vorgehen: Aus RC-only-Posterior-Samples werden für 4 GGL-Bins ΔΣ(R)-Kurven erzeugt und mit vollständiger Kovarianz logL_true berechnet; anschließend wird die Gruppierungszuordnung RC-bin→GGL-bin zufällig permutiert, um logL_perm zu erhalten. Die Closure-Stärke ist ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Zusätzlich gruppiert Run-10 die 20 RC-Bins zufällig zu 4×5 um und berechnet Closure neu, um die Abhängigkeit vom korrekten Mapping zu prüfen.

5 Hauptergebnisse und Interpretation


5.1 Hauptergebnis der gemeinsamen Anpassung (RC+GGL)

Die best logL_total der gemeinsamen Anpassung und der relative Vorteil ΔlogL_total gegenüber DM_RAZOR sind in Tabelle S1a und Abb. S4 dargestellt. In der Hauptvergleichsmenge besitzt EFT_BIN den größten gemeinsamen Vorteil (ΔlogL_total=1337.210); die übrigen EFT-Kernformen bleiben ebenfalls deutlich im Vorteil (1154.827–1294.442). Auch AICc/BIC bevorzugen die EFT-Familie deutlich, sodass der Vorteil nicht aus der Parameterzahl stammt.

Hinweis: Der Hauptbeitrag zu ΔlogL_total≈1337 stammt aus dem RC-Term (im joint split ΔlogL_RC≈1065, rund 80 %). Das lässt sich als milde Verbesserung von etwa Δχ²≈0.90 pro Punkt über N=2295 RC-Datenpunkte verstehen, die sich unter diagonaler Gauß-Likelihood natürlich zu einer Größenordnung von 10^3 aufsummiert. GGL und Closure liefern zusätzlich unabhängige datenübergreifende Einschränkungen, und die Rangfolge bleibt unter σ_int-, R_min- und cov-shrink-Stresstests stabil (siehe Abschnitt 6 und Tabelle S1b).


5.2 Ergebnis des Closure-Tests (RC-only → GGL)

Die zentrale Größe ΔlogL_closure ist in Tabelle S1b und Abb. S3 angegeben. Die EFT-Familie erreicht Closure-Stärken von 171.977–280.513 und liegt damit über DM_RAZOR mit 126.678. Das bedeutet: Ohne zusätzliche datenübergreifende Freiheitsgrade haben aus RC-Daten gewonnene EFT-Posterior-Samples stärkere übertragbare Vorhersagekraft für GGL.

Die Negativkontrolle stützt die physikalische Relevanz des Closure-Signals: Wird die RC-bin→GGL-bin-Gruppierung zufällig geshuffelt, sinkt die EFT-Closure-Stärke auf 6–15, während die Basismapping-Closure 172–281 erreicht. Dieser Signaleinbruch schließt eine Pseudobevorteilung durch numerische Umsetzung, Einheitenfehler oder falsche Kovarianzbehandlung weitgehend aus.

Abb. R1 | Negativkontrolle: Nach shuffle-Gruppierung sinkt das Closure-Signal deutlich (basierend auf Tab_Z1-Metriken).


5.3 Bedeutung und Grenzen der Ergebnisse

Die Schlussfolgerung lautet: In diesem Datensatz und unter diesem Protokoll ist die mittlere EFT-Gravitationskorrektur besser als die getestete DM_RAZOR-Basislinie. Wichtig ist: Die DM-Seite nutzt nur eine minimale NFW-Basislinie mit fester c(M)-Beziehung und ohne Core, Nicht-Sphärizität, Umwelteffekte oder komplexe Galaxie-Halo-Verbindungsmodelle. Der Artikel schließt daher nicht alle DM-Modellfamilien aus; er bietet eine reproduzierbare Closure-zentrierte Vergleichsbasis, um zu prüfen, ob RC und GGL durch dieselben datenübergreifenden Parameter und Zuordnungen konsistent erklärt werden können.

Zur Beantwortung dieser häufigen Rückfrage wurde das Erweiterungsprojekt P1A abgeschlossen (Anhang B). Ohne die gemeinsame RC-bin→GGL-bin-Zuordnung oder den Audit-Rahmen zu verändern, wird die DM-Basislinie standardisiert und auditierbar verstärkt: Neben drei Ein-Parameter-Erweiterungen (SCAT/AC/FB) werden (i) hierarchischer c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) ein Ein-Parameter-baryonic-feedback-Core-Proxy (DM_CORE1P) und (iii) ein Linsen-Scherkalibrierungs-nuisance m (DM_RAZOR_M) eingeführt; zusätzlich wird DM_STD als Kombinationsmodell angegeben. EFT_BIN bleibt Referenz.

• DM_RAZOR_SCAT (c–M scatter) — führt einen halo-to-halo-Streuparameter σ_logc ein, um zu prüfen, ob eine feste c(M)-Beziehung DM systematisch unterschätzt.
• DM_RAZOR_AC (Adiabatic Contraction) — verwendet einen Parameter α_AC zur Interpolation zwischen keiner Kontraktion und Standardkontraktion, um baryonisch verursachte Innenbereichskontraktion minimal abzubilden.
• DM_RAZOR_FB (Feedback / core) — beschreibt mit einer Kernskala (z. B. log r_core) die Unterdrückung der Rotationskurve im Innenbereich durch Core-Bildung, während auf Linsenskalen die NFW-Näherung erhalten bleibt.

Das quantitative P1A-Scoreboard steht in Anhang B, Tabelle B1 / Abb. B1; das P1A-Paket wird unter demselben Zenodo Concept DOI aufgenommen: https://doi.org/10.5281/zenodo.18526286.

6 Robustheit und Kontrollversuche


6.1 σ_int-Scan (Run-5)

Wir scannen die intrinsische Streuung σ_int der RC-Daten systematisch und wiederholen bei jedem σ_int die gemeinsame Inferenz. Die Minimal- und Maximalwerte von ΔlogL_total relativ zu DM_RAZOR stehen in Tabelle S1b.

Abb. R2 | Bereich von ΔlogL_total im σ_int-Scan (größer ist besser).


6.2 R_min-Scan (Run-6)

Um Einflüsse zentraler Systematiken wie nichtkreisförmige Bewegungen, Auflösung oder unzureichende baryonische Modellierung zu testen, beschneiden wir die RC-Daten mit einem R_min-Schwellenwert und wiederholen die gemeinsame Inferenz. Der Vorteil der EFT-Familie bleibt im R_min-Scan positiv und der Größenordnung nach stabil.

Abb. R3 | Bereich von ΔlogL_total im R_min-Scan (größer ist besser).


6.3 cov-shrink-Scan (Run-7)

Zur Prüfung der Unsicherheit in der GGL-Kovarianz wenden wir auf jede Massen-Bin-Kovarianz shrinkage an: C_α=(1−α)C+α·diag(C), und scannen α. Der Vorteil der EFT-Familie ist gegenüber dieser Behandlung unempfindlich.

Abb. R4 | Bereich von ΔlogL_total im cov-shrink-Scan (größer ist besser).


6.4 Ablationstreppen (Run-8)

Innerhalb von EFT_BIN führen wir verschachtelte Ablationen durch: vom Minimalmodell ohne freie Parameter über Modelle mit wenigen Freiheitsgraden bis hin zum vollständigen 20-bin-Amplitudenmodell plus globaler Skala. AICc/BIC zeigen, dass das vollständige EFT_BIN-Modell für die Datenerklärung deutlich notwendig ist.

Abb. R5 | Ablationstreppen von EFT_BIN (AICc, kleiner ist besser).


6.5 Leave-out-Vorhersage (Run-9)

Wir führen zusätzlich Leave-one-bin-out-Tests (LOO) durch: Von den 4 GGL-Massen-Bins wird jeweils einer ausgelassen; die übrigen Bins und alle RC-Daten dienen zur Inferenz, anschließend wird die Test-Log-Likelihood im ausgelassenen Bin bewertet. Die Zusammenfassung steht in Tab_R3_leave_one_bin_out; die EFT-Familie ist selbst im ungünstigsten ausgelassenen Fall deutlich besser als DM_RAZOR.

Abb. R6 | LOO: Log-Likelihood-Verteilung des ausgelassenen Bins (aus Run-9-Produkten).


6.6 Negativkontrolle: RC-bin shuffle (Run-10)

Run-10 gruppiert die 20 RC-Bins zufällig zu 4×5 um und berechnet Closure bei unveränderter RC-only-Posterior-Verteilung neu. Im Vergleich zur ursprünglichen Zuordnung senkt shuffle die mean logL_true und ΔlogL_closure deutlich (siehe Tabelle S1b und Abb. R1), was die Interpretierbarkeit des Closure-Signals weiter stützt.

Abb. R7 | Negativkontrolle: shuffle-Zuordnung senkt mean logL_true der Closure deutlich (aus Run-10-Produkten).

7 Rückverfolgbarkeit und Konsistenzaudit (Provenance)

Alle im Artikel zitierten Zahlen sind in den streng zusammengefassten Tabellen und Audit-Protokollen des Release-Archivs einzeln rückverfolgbar. Für bessere Lesbarkeit wurden die vollständigen Nachweisketten (Tag-Listen, Audittabellen, Checksum-Listen und Prüfverfahren) in Anhang A ausgelagert.

8 Reproduzierbarkeit und Zenodo-Archiv (Reproducibility & Archive)

Daten- und Codeverfügbarkeit: Bericht Concept DOI: https://doi.org/10.5281/zenodo.18526334; vollständiges Reproduktionspaket Concept DOI: https://doi.org/10.5281/zenodo.18526286. Details stehen in Anhang A und B.

Unter demselben Concept DOI des vollständigen Reproduktionspakets (https://doi.org/10.5281/zenodo.18526286) stellen wir zwei reproduzierbare Zugänge nach Verwendungszweck bereit:
• P1 (Haupttext) full_fit_runpack: reproduziert RC-only / closure / joint für EFT vs DM_RAZOR sowie die Robustheitsscans und erzeugt die Assets des Haupttexts, darunter Tabelle S1a/S1b und Abbildung S3/S4;
• P1A (Anhang B) full_fit_runpack: reproduziert den Standardisierungs-Stresstest der DM-Basislinie (SCAT/AC/FB + hierarchischer c–M-scatter-prior + core1p + lensing m + DM_STD; mit EFT_BIN-Kontrolle) und erzeugt Tabelle B1 und Abbildung B1 des Anhangs.
Die ergänzenden Tabellen/Abbildungen von P1A und der zugehörige full_fit_runpack werden als Zusatzdateien in denselben Concept DOI aufgenommen, damit ein einziger Archivzugang erhalten bleibt.

9 Danksagung und Erklärungen


9.1 Danksagung

Wir danken den SPARC- und KiDS-1000-Teams für öffentliche Daten und Dokumentation sowie den Mitwirkenden am Rekonstruktions- und Auditprozess dieses Projekts.


9.2 Autorenbeitrag

Guanglin Tu war verantwortlich für Konzeptentwicklung, Studiendesign, technische Umsetzung, Datenaufbereitung, formale Analyse, Implementierung des Reproduktionsprozesses, Audit und Manuskripterstellung.


9.3 Finanzierung

Persönliche Selbstfinanzierung durch Guanglin Tu (keine externe Förderung / keine Fördernummer).


9.4 Interessenkonflikte

Guanglin Tu steht in Verbindung mit der „EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (China)“; weitere Interessenkonflikte bestehen nicht.


9.5 KI-Unterstützung

OpenAI GPT-5.2 Pro und Gemini 3 Pro wurden für sprachliche Politur, strukturierte Redaktion und Aufbereitung des Reproduktionsablaufs genutzt; sie wurden nicht zur Erzeugung oder Änderung von Daten, Ergebnissen, Abbildungen oder Code und nicht zur Generierung von Zitaten verwendet. Der Autor trägt die volle Verantwortung für Inhalt und Zitiergenauigkeit.

10 Literatur

Anhang A: Details zu Rückverfolgbarkeit und Reproduzierbarkeit

Dieser Anhang bündelt langfristig archivierte Informationen zu Rückverfolgbarkeit und Reproduzierbarkeit (Run-Tags, Audit-Ergebnisse, Archivlisten und Prüfpunkte), damit Leserinnen und Leser bei Bedarf prüfen und reproduzieren können.


A.1 Rückverfolgbarkeit und Auditdetails

Zur langfristigen Rückverfolgbarkeit verwendet das Projekt für jeden Lauf und jedes Ergebnis Zeitstempel-Tags und überschreibt historische Artefakte nicht. Die zitierten Kernwerte stammen aus der strengen Zusammenfassung (compile_tag=20260205_035929) und haben folgende Konsistenzaudits bestanden:

• Alle Zwischentabellen tragen run_tag und stage tag; das strenge Zusammenfassungsskript wählt aus report/tables vollständige und konsistente canonical Tabellenquellen aus.

• Die Werte von Tab_Z1_master_summary und Tab_Z2_conclusion_highlights wurden einzeln mit den gewählten canonical Tabellen verglichen.

• Bei der PDF-Erzeugung wurde ein Tag-Audit der referenzierten Tabellen und Abbildungen durchgeführt, um die Vermischung alter Artefakte auszuschließen.

Wichtige Tags zur Lokalisierung aller Zwischenprodukte: run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

Konsistenzaudit: Tab_AUDIT_checks_strict zeigt pass=9, fail=0, skip=0 (Details im Release-Paket).


A.2 Reproduktionsschritte und Archivliste

Die Studie nutzt ein Reproduktionssystem aus veröffentlichungsreifem Bericht, Tabellen- und Abbildungs-Supplement und vollständigem wiederholbarem Runpack. Das Supplement erlaubt die schnelle Prüfung aller zitierten Tabellen und Abbildungen; das full_fit_runpack ermöglicht die Reproduktion von Grund auf und den Vergleich der erzeugten Werte mit Referenztabellen.


A.2.1 Reproduktions-Quickstart (RUN_FULL, Windows PowerShell)

Dieser Abschnitt gibt einen kurzen Reproduktionspfad unter Windows PowerShell. Für eine schnelle Prüfung genügt das Tables & Figures Supplement; für End-to-End-Reproduktion verwenden Sie das full_fit_runpack und führen verify_checksums.ps1 sowie RUN_FULL.ps1 gemäß README/ONE_PAGE_REPRO_CHECKLIST aus (empfohlen: Mode=full).

Zenodo-Archiveinstieg (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Tags der Hauptkette: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.2.2 Archivmaterialien und zentrale Prüfpunkte (Packages & checks)

Zenodo stellt drei komplementäre Materialklassen bereit: (1) veröffentlichungsreifer Bericht (dieser Artikel, v1.1, mit Anhang B zu P1A); (2) Tables & Figures Supplement für alle zitierten Tabellen und Abbildungen zu P1 und P1A; (3) full_fit_runpack zur vollständigen Reproduktion von Grund auf. (1)–(2) unterstützen schnelle Lektüre und unabhängige Prüfung, (3) bietet End-to-End-Reproduzierbarkeit.

Materialkategorie

Dateiname (Beispiel)

Zweck und Einordnung (empfohlene Reihenfolge)

Veröffentlichungsreife Berichte (Chinesisch und Englisch)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

Vollständiger Zenodo-Bericht; Haupttext mit Kernaussagen und Robustheitsaudit, Anhang B mit P1A.

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

Alle im Haupttext zitierten Tabellen (CSV) und Abbildungen (PNG), inklusive Skripten und Tag-Dateien.

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

Alle in Anhang B zitierten Tabellen und Abbildungen, inklusive Tab_S1_P1A_scoreboard und Fig_S1_P1A_scoreboard.

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

End-to-End-Reproduktion: Daten von Grund auf laden und RC-only/closure/joint sowie Robustheitsscans neu ausführen.

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

End-to-End-Reproduktion für Anhang B: DM 7+1 + DM_STD mit EFT_BIN-Referenz neu ausführen; enthält Referenztabellenprüfung.

Zitiervorschlag: Bitte geben Sie beim Zitieren dieses Artikels oder der Begleitmaterialien den Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334) an.

Nach der Reproduktion sollten unter anderem folgende Schlüsselprodukte erscheinen und vergleichbar sein:

Anhang B: P1A — Standardisierter Stresstest der DM-Basislinie (DM 7+1 + DM_STD, mit EFT-Vergleich)

Dieser Anhang dokumentiert ein Erweiterungsprojekt (P1A), das im selben Closure-Protokoll wie der Haupttext einen standardisierten DM-Basislinien-Stresstest durchführt. Ziel ist, die minimale DM_RAZOR-Basislinie (NFW + feste c–M-Beziehung, kein scatter, keine Kontraktion, kein Core) zu einer astrophysikalisch näherliegenden und gegenüber gängigen Einwänden robusteren DM-Basislinienmenge auszubauen, ohne viele Freiheitsgrade einzuführen und ohne gemeinsame Zuordnung oder Audit-Rahmen zu verändern. P1A enthält die legacy-Zweige SCAT/AC/FB und ergänzt hierarchischen c–M scatter + prior, einen Ein-Parameter-Core-Proxy, ein Linsen-Scherkalibrierungs-nuisance m und das Kombinationsmodell DM_STD; EFT_BIN bleibt Vergleichsreferenz.

Ergänzender Hinweis: Die Werte der Closure-Stärke in Anhang B (P1A) verwenden ein höheres Monte-Carlo-Budget (z. B. ndraw=400, nperm=24) als der quick-Modus im Haupttext (z. B. ndraw=60, nperm=12), der die vollständige EFT-Kernfamilie abdeckt. Absolute Werte können daher um O(10) driften; Vergleiche innerhalb derselben Tabelle und desselben Budgets sind fair, und Vorzeichen sowie Größenordnung des Vorteils bleiben stabil.


B.1 Zweck und Einordnung (Why P1A, and why as an Appendix)

P1A versucht nicht, alle ΛCDM-Halo-Modellierungsoptionen auszuschöpfen, etwa Nicht-Sphärizität, Umwelteffekte, komplexe Galaxie-Halo-Verbindung oder hochdimensionale baryon physics. Stattdessen folgt P1A dem Prinzip „niedrigdimensional, auditierbar, reproduzierbar“: Jedes Modul führt höchstens einen zentralen effektiven Parameter ein und bleibt drei harten Bedingungen unterworfen:
(i) Parameterbuchführung: Neue Parameter müssen klar verbucht und mit AICc/BIC berichtet werden.
(ii) Gemeinsame Zuordnung: dieselbe RC-bin→GGL-bin-Gruppierung; keine separate Mapping-Anpassung für einzelne Datensätze.
(iii) Closure-Test: Jede Erweiterung muss echten Gewinn in der RC→GGL-Übertragung zeigen, nicht nur eine bessere RC-only-Anpassung.


B.2 DM 7+1 + DM_STD: Moduldefinitionen, Parameter und Eintritt in die gemeinsame Posterior-Verteilung

P1A stellt als eigenständiges runpack 8 DM-Arbeitsbereiche (DM 7+1) und 1 EFT-Referenz bereit: Ausgehend von DM_RAZOR entstehen drei legacy-Ein-Parameter-Erweiterungen (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), drei standardisiertere defensive Module (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) und das Kombinationsmodell DM_STD. Gemeinsam adressieren sie drei typische Einwände: (a) scatter und prior der c–M-Beziehung im hierarchischen Modell; (b) Repräsentation des Haupteffekts baryonischen Feedbacks durch einen Ein-Parameter-Core-Proxy; (c) mögliche Verwechslung einer Linsen-Systematik mit einem physikalischen Signal.

Workspace

dm_model

neuer Parameter (≤1)

physikalische Motivation

auditfreundliches Implementationsprinzip

DM_RAZOR

NFW (fixed c–M, no scatter)

Minimierte, auditierbare ΛCDM-Halo-Basislinie für strengen Vergleich mit EFT

gemeinsame Zuordnung fix; strenge Parameterbuchführung; nur relative Baseline

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

c–M-Streuung; Ein-Parameter-lognormaler scatter

≤1 neuer Parameter; gemeinsame Zuordnung; Closure-Gewinn als Kriterium

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Baryonischer Einfall kann Halo-Kontraktion auslösen; Ein-Parameter-Näherung

≤1 neuer Parameter; Mapping unverändert; AICc/BIC und Closure berichten

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Feedback kann einen Core im Innenbereich erzeugen; Ein-Parameter-Core-Skala

≤1 neuer Parameter; gleiches Closure/Negativkontroll-Protokoll

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

Standardisiertere Hierarchie c_i∼logN(c(M_i),σ_logc); betrifft RC und GGL

expliziter Prior; latente c_i marginalisiert; niedrigdimensional

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14-inspired)

log r_core

Baryonic-feedback-Haupteffekt als Ein-Parameter-Core-Proxy

Standardliteratur; ≤1 neuer Parameter; an Closure-Test gebunden

DM_RAZOR_M

NFW + lensing shear-calibration nuisance

m_shear (GGL)

Linsenseitige Systematik über effektiven Parameter erfassen

nuisance verbucht; keine Rückwirkung auf RC; Closure-Robustheit zentral

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Drei gängige Einwände in einer niedrigdimensionalen Standardbasislinie

Parameterbuchführung + Informationskriterien; Closure als Hauptmetrik

Erläuterung: Die Parameternamen folgen der technischen Implementierung (z. B. σ_logc, α_AC, log r_core, m_shear). P1A soll die DM-Basislinie stärken, ohne die DM-Seite in einen unkontrollierbaren hochdimensionalen Fitter zu verwandeln. Besonders DM_HIER_CMSCAT führt c–M scatter hierarchisch ein: Die Konzentration c_i jedes Halos folgt einer lognormalen Streuung um c(M_i), begrenzt durch globales σ_logc und c(M)-Prior; diese Struktur beeinflusst die gemeinsame Posterior-Verteilung von RC und GGL.


B.3 Statistisches Protokoll und Produktlogik wie im Haupttext

P1A verwendet sämtliche Datenprodukte, die gemeinsame Zuordnung und den Audit-Rahmen des Haupttexts. Ablauf und Produktlogik bleiben gleich:
(1) Run‑1: RC-only-Inferenz (posterior_samples.npz und metrics.json);
(2) Run‑2: RC→GGL-Closure-Test (closure_summary.json und permutierte Basislinie);
(3) Run‑3: gemeinsame RC+GGL-Anpassung (joint_summary.json).
Alle zitierten Zahlen stammen aus der automatisch erzeugten Tab_S1_P1A_scoreboard und lassen sich im full_fit_runpack durch den eingebauten Referenztabellenvergleich prüfen.


B.4 Hauptergebnisse, Tabellen-/Abbildungseinstieg und Archivplan (same DOI)

Dieser Abschnitt fasst die quantitativen P1A-Ergebnisse zusammen. Tabelle B1 zeigt die wichtigsten Metriken für RC-only, RC→GGL-Closure und RC+GGL-joint (Klammern: Differenz zur DM_RAZOR-Basislinie). Die Closure-Stärke ist ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩; größer ist besser. Abb. B1 visualisiert dasselbe Scoreboard. Kernaussagen:
• Unter den legacy-Zweigen verbessert nur DM_RAZOR_FB (feedback/core) die Closure-Stärke leicht: 122.21→129.45 (+7.25); SCAT und AC bringen keinen Nettozuwachs.
• DM_HIER_CMSCAT und DM_RAZOR_M haben nur sehr geringen Einfluss (~0); DM_CORE1P zeigt ebenfalls keinen signifikanten Nettozuwachs.
• DM_STD verbessert joint logL deutlich, senkt jedoch die Closure-Stärke; der Gewinn stammt also eher aus Fit-Flexibilität als aus datenübergreifender Vorhersagekraft.
• EFT_BIN behält als Vergleichsreferenz bei Closure und joint fitting einen deutlichen Vorteil. Die Hauptaussage bleibt daher auch nach einer stärkeren DM-Basislinie und Linsen-nuisance robust.

Zum direkten Vergleich fasst Tab S1a–S1b im Haupttext die strengen Ergebnisse von EFT-Familie und DM_RAZOR zusammen: EFT verbessert joint fitting relativ zu DM_RAZOR um ΔlogL_total≈1155–1337 und erreicht im Closure-Test ΔlogL_closure=172–281. P1A macht die DM-Seite lediglich zu einem härteren Vergleich, um Einwände wie strawman baseline oder systematics-as-physics abzumildern; es ersetzt nicht den Hauptvergleich.

Tabelle B1 | P1A-Scoreboard (größer ist besser; Klammern: Differenz zur DM_RAZOR-Basislinie).

Modellzweig (workspace)

Δk

RC-only best logL_RC (Δ)

Closure-Stärke ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Abb. B1 | P1A-Scoreboard: ΔlogL für Closure und joint relativ zur Basislinie (größer ist besser).

Beispielhafte Tags der abgeschlossenen P1A-Läufe zur Lokalisierung von Zwischenprodukten und Tabellen/Abbildungen:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 Empfohlene Zitierweise (Appendix citation note)

Wenn der standardisierte DM-Basislinien-Stresstest zusätzlich zur Hauptaussage zitiert werden soll, empfehlen wir, neben dem Hauptbefund zu vermerken: ‘See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.’