P1_RC_GGL: строгий тест замикання для динаміки галактик і слабкого лінзування (криві обертання + GGL)
Рамка середньої гравітації EFT проти мінімальної NFW-базової моделі холодної темної матерії (DM)
Ознайомтеся з оригінальним звітом з оцінювання:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 Резюме
Цей звіт є архівною редакцією публікаційного рівня, розміщеною на Zenodo. Він надає інтегрований, придатний для аудиту ланцюг, що охоплює дані, реєстр моделей, справедливе порівняння, тестування замикання та матеріали відтворюваності. Додаток B (P1A) слугує доповненням щодо робастності. Він зосереджений на стрес-тестах за схемою «стандартніша DM-базова модель + одна ключова систематика лінзування», щоб оцінити чутливість головних висновків до реалістичнішого моделювання DM і обробки систематик лінзування.
Основні висновки (чотири формулювання, які можна цитувати безпосередньо; див. розділ 2.4):
(1) У підгонці кривих обертання (RC) сімейство EFT істотно перевершує DM_RAZOR за всіх комбінацій ядер і апріорів; типовий приріст становить Δlog𝓛_RC ≈ 10^3 (див. таблицю S1a).
(2) У тесті замикання RC→GGL EFT демонструє сильнішу переносимість між різними спостережними пробами: сила замикання Δlog𝓛_closure (True−Perm) значно вища, ніж у DM_RAZOR, а різниця є робастною щодо shrinkage коваріації та сканувань R_min і σ_int (див. рис. S3 і таблицю S1b).
(3) У спільній підгонці (RC+GGL) EFT зберігає стабільну перевагу; у негативному контролі, який руйнує спільне відображення, ця перевага зникає, підтримуючи тлумачення, що «ефект середньої гравітації» походить від спільного відображення, а не від випадкової підгонки (див. рис. S4).
(4) Без суттєвого збільшення розмірності Додаток B (P1A) стрес-тестує сторону DM за допомогою стандартніших модулів DM-базової моделі та однієї ключової nuisance-змінної систематики лінзування. Ці посилення не усувають перевагу EFT у замиканні (див. таблицю B1 і рис. B1).
Доступність даних і коду: Concept DOI звіту 10.5281/zenodo.18526334; Concept DOI повного пакета відтворення 10.5281/zenodo.18526286. Теги, що відповідають Додатку B (P1A): run_tag=20260213_151233, closure_tag=20260213_161731 та joint_tag=20260213_195428.
1 Анотація
Ми проводимо відтворюване кількісне порівняння двох теоретичних рамок на тих самих даних і за тим самим статистичним протоколом: моделі «поправки середньої гравітації», запропонованої Теорією енергетичних ниток (Energy Filament Theory, EFT; не слід плутати зі звичайним скороченням effective field theory), та базової моделі гало NFW для холодної темної матерії (DM_RAZOR). DM_RAZOR свідомо обрано як «мінімальну DM-базову модель»: гало NFW із фіксованим співвідношенням c–M (без розсіяння між гало), що слугує контрольним випадком, придатним для аудиту й відтворення. Також слід підкреслити, що в цій роботі EFT розглядається як феноменологічна MOND-подібна параметризація ефективного поля / ефективної відповіді для тестування в межах єдиного статистичного протоколу, а не як виведення її мікроскопічних перших принципів у цій статті.
Дані складаються з 2 295 точок швидкостей із кривих обертання SPARC (RC), уніфіковано попередньо оброблених і розбитих на біни (104 галактики, 20 RC-бінів), разом із надлишковою поверхневою густиною ΔΣ(R) для галактика–галактика слабкого лінзування KiDS-1000 (GGL) (4 біни зоряної маси × 15 точок R у кожному біні, загалом 60 точок, із використанням повної коваріації).
Ми послідовно виконуємо RC-only інференцію, тест замикання RC→GGL, GGL-only інференцію та спільну інференцію RC+GGL, використовуючи аудити узгодженості, щоб кожне наведене числове значення було простежуваним. За суворого реєстру параметрів і обмежень спільного відображення (DM: 20 параметрів log M200_bin; EFT: 20 параметрів log V0_bin + 1 глобальний log ℓ) сімейство EFT істотно перевершує DM_RAZOR у спільній підгонці: ΔlogL_total = 1155–1337 відносно DM_RAZOR. Важливіше те, що тест замикання показує нетривіальну прогнозну силу RC-постеріора для GGL: сила замикання EFT дорівнює ΔlogL_closure = 172–281, що вище за 127 у DM_RAZOR. Коли групування RC-bin→GGL-bin випадково перемішується, сигнал замикання падає до 6–23, підтверджуючи, що сигнал не є статистичною випадковістю або артефактом реалізації. У систематичних скануваннях σ_int, R_min і shrinkage коваріації відносна перевага EFT залишається додатною і стабільною за масштабом. Щоб відповісти на поширені застереження, що «DM-базова модель надто слабка» або що «систематики помилково приймаються за фізику», Додаток B (P1A) подає стандартніший, але все ще низькорозмірний і придатний для аудиту стрес-тест DM-базової моделі, включно з ієрархічним розсіянням c–M + апріором, одно-параметричним proxy ядра, лінзувальним m і комбінованою моделлю DM_STD. За тим самим протоколом замикання ці посилення не усувають переваги EFT у замиканні (див. таблицю B1/рис. B1).
Ключові слова: криві обертання; галактика–галактика слабке лінзування; тест замикання; EFT; холодна темна матерія; баєсівська інференція
2 Вступ і огляд результатів
Криві обертання (RC) і галактика–галактика слабке лінзування (GGL) є двома взаємодоповнювальними гравітаційними пробами: RC обмежує динамічний потенціал і радіальне прискорювальне співвідношення (RAR) у площині диска, тоді як GGL вимірює проєктований розподіл маси та гравітаційну відповідь на масштабі гало. Для будь-якої кандидатної теорії ключове питання полягає не в тому, чи може вона окремо підігнати два набори даних, а в тому, чи може вона узгоджено пояснити їх у межах того самого міжданого відображення та спільних обмежень.
Відповідно, ця стаття бере «тест замикання» як свій центральний статистичний протокол: спочатку RC-only постеріор використовується для прямого прогнозу GGL, а потім результат порівнюється з негативним контролем, у якому відображення RC-bin→GGL-bin переставляється / перемішується. Це оцінює переносимість прогнозу між наборами даних і виключає хибні сигнали, спричинені упередженням реалізації або випадковою підгонкою.
Теоретичне позиціювання та межі: ця стаття не намагається подати мікроскопічне виведення EFT (Energy Filament Theory) з перших принципів або релятивістськи повне формулювання. Натомість ми трактуємо EFT як низькорозмірну MOND-подібну параметризацію ефективного поля / ефективної відповіді (описану ядром f(x) і глобальним масштабом ℓ) та тестуємо її міждану узгодженість і переносиму прогнозну силу за допомогою тесту замикання RC→GGL за суворого реєстру параметрів.
Дослідницька програма та формулювання меж: ця стаття є частиною поточної P-серії програми спостережного відновлення. У наявних даних галактичного масштабу ми шукаємо два можливі ефективні фонові внески: (i) «підлогу середньої гравітації», яку можна описати грубозерненою середньою гравітаційною відповіддю, і (ii) «стохастичну/шумову підлогу», пов’язану з флуктуаціями мікроскопічних процесів. У цій статті (P1) ми зосереджуємося лише на першому: не вводячи жодної гіпотези про мікроскопічні механізми утворення, ми використовуємо тест замикання RC→GGL, щоб відновити спостережні ознаки підлоги середньої гравітації та порівняти її з придатною для аудиту DM-базовою моделлю в єдиному контрольному протоколі. Як евристична фізична картина: якщо існують короткоживучі ступені свободи, їхній розпад/анігіляція може перетворювати масу спокою на енергію-імпульс, перенесену іншими ступенями свободи, що на ефективному рівні природно відповідає розкладу «середній внесок + флуктуаційний внесок»; однак ця стаття не моделює цю мікроскопічну картину кількісно.
Щоб уникнути надінтерпретації, межі цієї статті такі:
• Що робить ця стаття: за суворого реєстру параметрів і обмежень спільного відображення вона використовує тестування замикання, щоб виміряти міждану переносимість прогнозу, і проводить відтворюване порівняння між EFT-відповіддю середньої гравітації та DM-базовою моделлю.
• Чого ця стаття не робить: вона не обговорює мікроскопічні механізми утворення, чисельності/часи життя або космологічні обмеження; вона не моделює стохастичний член, що відповідає «шумовій підлозі».
• Чого ця стаття не стверджує: вона не має на меті спростувати темну матерію; P1 не дає остаточного вердикту щодо існування такої «підлоги», а повідомляє про доказ на рівні етапу — у вибраній тут робастній області вимірювання дані віддають перевагу моделям, що включають середню гравітаційну відповідь.
Водночас ми чітко зазначаємо, що DM_RAZOR представляє лише мінімальну й придатну для аудиту NFW-базову модель (фіксоване c–M і відсутність розсіяння; без адіабатичного стискання, feedback-ядра, несферичності або середовищних членів). Тому головний висновок основного тексту суворо обмежується таким твердженням: за мінімальної базової моделі та суворих обмежень реєстру параметрів/відображення EFT показує сильнішу міждану узгодженість. Щоб відповісти на поширене питання, чи істотно змінила б висновок стандартніша ΛCDM-базова модель і моделювання ключових систематик лінзування, ми зібрали стандартніші, але все ще низькорозмірні та придатні для аудиту DM-посилення й nuisance-змінну з боку лінзування в Додатку B (P1A: стрес-тест стандартизації DM-базової моделі), зберігаючи точно те саме спільне відображення й протокол тесту замикання, що й в основному тексті (див. таблицю B1/рис. B1).
2.1 Табл. S1a–S1b: зведення ключових метрик (суворе)
Таблиця S1a подає головні метрики порівняння для спільної підгонки (RC+GGL): logL, ΔlogL, AICc і BIC. Таблиця S1b подає метрики тесту замикання та сканувань робастності: замикання, негативний контроль із перемішуванням і діапазони сканувань σ_int / R_min / cov-shrink. Усі значення походять із суворої головної зведеної таблиці Tab_Z1_master_summary і можуть бути простежені пункт за пунктом у релізному архівному пакеті.
Таблиця S1a | Основні метрики порівняння спільної підгонки (RC+GGL, суворий режим).
Модель (робочий простір) | Ядро W | k | Спільний logL_total (найкращий) | ΔlogL_total проти DM | AICc | BIC |
DM_RAZOR | немає | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | немає | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | експоненційне | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | Юкава | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Таблиця S1b | Метрики замикання та робастності (суворий режим).
Модель (робочий простір) | ΔlogL замикання (true-perm) | ΔlogL негативного контролю після shuffle | Діапазон ΔlogL у скануванні σ_int | Діапазон ΔlogL у скануванні R_min | Діапазон ΔlogL у скануванні cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 Рис. S3: сила замикання (RC-only → прогнозований GGL)
Сила замикання визначається як ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: на RC-only постеріорних вибірках GGL прогнозується вперед і порівнюється з негативним контролем, у якому відображення RC-bin→GGL-bin переставляється.

Рис. S3 | Сила замикання (більше — краще): середня перевага log-likelihood прогнозу RC-only → GGL.
2.3 Рис. S4: головне порівняння спільної підгонки (RC+GGL)
Перевага спільної підгонки визначається як ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR). На тих самих даних, з тим самим відображенням і майже тим самим масштабом параметрів сімейство EFT досягає значно вищого спільного log-likelihood.

Рис. S4 | Перевага спільної підгонки (більше — краще): найкращий logL_total для RC+GGL відносно DM_RAZOR.
2.4 Чотири висновки (для прямого цитування)
(1) В єдиному спільному аналізі кривих обертання SPARC і слабкого лінзування KiDS-1000 модель рамки середньої гравітації EFT систематично перевершує DM_RAZOR за суворого контрольного протоколу: ΔlogL_total = 1155–1337 відносно DM_RAZOR.
(2) Тест замикання RC→GGL показує сильнішу прогнозну узгодженість для EFT: ΔlogL_closure = 172–281 порівняно зі 127 для DM_RAZOR. Коли групування RC-bin→GGL-bin випадково перемішується, сигнал замикання падає до 6–23, що вказує: сигнал залежить від правильного міжданого відображення, а не від випадкової підгонки.
(3) Систематичні сканування σ_int, R_min і shrinkage коваріації не змінюють ні знак, ні масштаб твердження «EFT перевершує DM_RAZOR», що показує робастність висновку до поширених систематичних збурень.
(4) За тим самим протоколом замикання Додаток B (P1A) посилює DM-базову модель у «стандартизований і придатний для аудиту» спосіб: він зберігає три одно-параметричні посилення (SCAT/AC/FB) і додає ієрархічне розсіяння c–M + апріор, одно-параметричний proxy ядра та shear-калібрування m з боку лінзування (а також їхню комбіновану модель DM_STD). Результати показують, що лише гілка feedback/core дає невелике чисте покращення сили замикання (122.21→129.45, ΔΔlogL_closure≈+7.25); інші посилення дають незначний або негативний внесок у силу замикання. Отже, головний висновок не залежить від того, що DM_RAZOR була надто слабкою базовою моделлю.
3 Дані та попередня обробка
У цьому дослідженні використано два публічні набори даних. У межах інженерного workflow завантаження, перевірка контрольних сум (sha256) і попередня обробка виконуються простежуваними скриптами. Щоб забезпечити справедливе міжмодельне порівняння, усі робочі простори (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) використовують точно ті самі продукти даних і бінові відображення.
3.1 Криві обертання (RC, SPARC)
Дані RC походять із файлів Rotmod_LTG бази SPARC (175 rotmod-файлів). Після попередньої обробки модельна вибірка містить 104 галактики та 2 295 точок даних (r, V_obs), поділених на 20 RC-бінів за зоряною масою та пов’язаними критеріями. Кожна точка даних містить радіус r (кпк), спостережену швидкість V_obs (км/с), спостережну похибку σ_obs, а також швидкості компонентів газу/диска/балджа (V_gas, V_disk, V_bul).
3.2 Слабке лінзування (GGL, KiDS-1000 / Brouwer+2021)
Дані GGL використовують надлишкову поверхневу густину ΔΣ(R) з рис. 3 Brouwer et al. (2021) на основі KiDS-1000 (4 біни зоряної маси, 15 точок R у кожному біні) разом із наданою повною коваріацією. В інженерному workflow початкова коваріація в довгій формі реконструюється у матрицю 15×15 для кожного біна, а аудити Stage-B перевіряють розмірнісну та числову правдоподібність.
3.3 Відображення RC-bin → GGL-bin і загальний розмір вибірки
4 масові біни GGL і 20 RC-бінів поєднані фіксованим відображенням: кожному GGL-біну відповідає 5 RC-бінів, а внески RC-бінів зважуються кількістю галактик. Це відображення фіксується для всіх моделей і є ключовим обмеженням для справедливого порівняння в тестуванні замикання та спільній підгонці. Остаточний спільний набір даних містить n_total = 2355 точок (RC=2295, GGL=60).
4 Моделі та статистичні методи
4.1 Мінімальна математична специфікація EFT і DM (придатна для аудиту/тестування)
Цей розділ подає мінімальну математичну специфікацію, яка безпосередньо відповідає реалізації.
(a) Модель кривих обертання (RC)
Для кожної точки RC-даних (r, V_obs, σ_obs) ми використовуємо суперпозицію компонентів: V_mod²(r) = V_bar²(r) + V_extra²(r). Тут V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). Основні результати цієї статті беруть Υ_d = Υ_b = 0.5, що узгоджується з емпіричними рекомендаціями SPARC і корисне для зменшення зайвих ступенів свободи.
(b) Поправка середньої гравітації EFT (EFT)
Додатковий член EFT параметризується у формі «середньої швидкості в квадраті»: V_extra²(r) = V0_bin² · f(r/ℓ). Тут V0_bin є параметром амплітуди для кожного RC-біна (20 параметрів), ℓ — глобальний масштаб (1 параметр), а f(x) — безрозмірна функція форми ядра. Форми ядер, порівнювані в цій статті (жодна з них не вводить додаткових неперервних ступенів свободи), такі:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (додатковий контроль) gaussian: f(x)=erf(x/√2) (не включено до головного набору висновків)
Фізична мотивація (розширено): EFT інтерпретує додаткову гравітаційну відповідь на галактичних масштабах як ефективну відповідь, отриману грубозерненням / масштабним усередненням більш мікроскопічних дій на скінченних масштабах. У цій статті ми не припускаємо конкретного мікроскопічного механізму; натомість використовуємо мінімальну й придатну для аудиту параметризацію для контрольованого порівняння та тестування в єдиному статистичному протоколі.
Для інтуїції додатковий член можна записати у формі прискорення: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). Коли r≫ℓ, f→1 і V_extra→V0_bin, що створює приблизно плаский внесок додаткової швидкості у зовнішній області. Коли r≪ℓ і f(x)≈x, можна ввести характерний масштаб прискорення a0,bin≈V0_bin²/ℓ (з точністю до O(1) множника функції ядра), що дає MOND-подібну інтуїцію для масштабу переходу від внутрішньої до зовнішньої області.
Дискретне сімейство ядер, використане тут (none/exponential/yukawa/powerlaw_tail), можна розглядати як низькорозмірні proxy для різних «початкових нахилів / швидкостей переходу / довгих хвостів» (наприклад, Yukawa-подібного екранування проти відповіді з довшим хвостом). Вони використовуються для стрес-тестування робастності, а не для вичерпання модельного простору. У компоненті слабкого лінзування ми будуємо ефективну масу та густину оболонки з V_avg(r), а потім проєктуємо їх для отримання ΔΣ(R). Цю ефективну густину слід розуміти як ефективний опис лінзувального потенціалу за припущень сферичної симетрії та слабкопольового відображення (повні деталі перенесено до Додатка A).
Усі наведені вище форми ядер задовольняють f(x)→1 при x→∞ (тобто насичення V_extra²→V0²), водночас даючи лінійне або сублінійне зростання для x≪1: наприклад, exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x. Тому різні форми ядер мають спостережувані відмінності в малорадіусному «початковому нахилі», швидкості переходу та зовнішньому хвості й можуть бути розрізнені спільними тестами RC+GGL і замикання.
Прогноз EFT для слабколінзувальної ΔΣ(R) отримується через виведення маси й густини оболонки з V_avg(r), після чого виконуються проєкційні інтеграли: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, і ΔΣ(R)=Σ̄(<R)−Σ(R). Числова реалізація використовує логарифмічну сітку й адаптивно уточнює її у виняткових випадках для забезпечення стабільності та відтворюваності.
(c) DM_RAZOR: NFW-базова модель гало холодної темної матерії
Водночас ми чітко зазначаємо, що DM_RAZOR представляє лише мінімальну, придатну для аудиту NFW-базову модель (фіксоване c–M і відсутність розсіяння; без адіабатичного стискання, feedback-ядра, несферичності або середовищних членів). Щоб зменшити ризик «солом’яної базової моделі», ця стаття не стверджує, що таких ефектів не існує. Натомість вона включає їх у Додаток B (P1A) як низькорозмірні та придатні для аудиту стрес-тести, зокрема ієрархічну обробку розсіяння c–M, proxy ядра та nuisance-змінну shear-калібрування з боку лінзування.
4.2 Реєстр моделей і справедливе порівняння (спільні параметри = визначення замикання)
Кількість параметрів у головному наборі порівняння така: DM_RAZOR k=20; сімейство EFT k=21 (додатковий параметр — глобальний log ℓ). Усі моделі мають ті самі RC-дані, ті самі GGL-дані й коваріацію, те саме відображення RC-bin→GGL-bin, ті самі баріонні члени та ті самі перетворення одиниць. Крім того, форма ядра (none / exponential / yukawa / powerlaw_tail) є дискретним вибором і не вводить додаткового неперервного параметра, запобігаючи перевазі завдяки «ще одному ступеню свободи».
4.3 Likelihood, апріори та семплер
RC-likelihood є діагонально-гаусівським: σ_eff² = σ_obs² + σ_int². Основні результати фіксують σ_int=5 км/с, а Run-5 сканує σ_int. GGL-likelihood використовує повноковаріаційний гаусіан для кожного біна: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). Спільна цільова функція: logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). Апріори переважно кодують фізично допустимі межі (інтервальні обмеження на log ℓ, log V0 і log M200); коли вмикаються вільні Υ і σ_int, використовуються слабко інформативні апріори (деталі див. у конфігурації реалізації та релізного пакета).
Семплер використовує адаптивний блочний випадковий блук Metropolis: на кожному кроці оновлюється лише випадковий підблок простору параметрів, щоб поліпшити коефіцієнт прийняття у високих розмірностях, а розмір кроку легко адаптується за віконним коефіцієнтом прийняття (цільовий коефіцієнт приблизно 0.25). Основні результати використовують quick mode (налаштування на кшталт n_steps=800), а кожен робочий простір виводить траси, залишки та PPC-графіки для ручних і скриптових аудитів.
4.4 Тест замикання та негативний контроль (визначення)
Тест замикання (Run-2) перевіряє, чи може RC-only постеріор прогнозувати GGL без повторної підгонки GGL. Зокрема, з RC-only постеріорних вибірок генерується ΔΣ(R) для 4 GGL-бінів і обчислюється logL_true з повною коваріацією; потім групове відображення RC-bin→GGL-bin випадково переставляється для отримання logL_perm. Сила замикання визначається як ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. Крім того, Run-10 випадково перегруповує 20 RC-бінів у 4×5 (shuffle) і знову обчислює замикання, перевіряючи, наскільки сильно сигнал замикання залежить від правильного відображення.
5 Основні результати та інтерпретація
5.1 Основні результати спільної підгонки (RC+GGL)
Найкращий logL_total зі спільної підгонки та відносна перевага ΔlogL_total (відносно DM_RAZOR) показані в таблиці S1a та на рис. S4. У головному наборі порівняння EFT_BIN має найбільшу спільну перевагу (ΔlogL_total=1337.210), тоді як інші форми ядер EFT також зберігають значні переваги (1154.827–1294.442). За інформаційними критеріями (AICc/BIC) сімейство EFT також істотно перевершує DM_RAZOR, що вказує: перевага не зумовлена упередженням через кількість параметрів.
Примітка: головний внесок у ΔlogL_total≈1337 походить від RC-члена (ΔlogL_RC≈1065 у спільному розкладі, приблизно 80%). Це можна розуміти як помірне покращення близько Δχ²≈0.90 на точку для N=2295 RC-точок даних, яке природно накопичується до переваги порядку 10^3 за діагонального гаусівського likelihood. Водночас GGL і тест замикання надають незалежні міжнабірні обмеження, а ранжування залишається стабільним у стрес-тестах σ_int, R_min і cov-shrink (див. розділ 6 і таблицю S1b).
5.2 Результати тесту замикання (RC-only → GGL)
Ключова величина тесту замикання ΔlogL_closure наведена в таблиці S1b і на рис. S3. Сімейство EFT має сили замикання 171.977–280.513, вищі за 126.678 у DM_RAZOR. Це означає, що без дозволу на додаткові міждані ступені свободи постеріорні вибірки, отримані EFT із RC-даних, мають сильнішу переносиму прогнозну силу для GGL-даних.
Негативний контроль додатково підтримує фізичну релевантність сигналу замикання: коли групування RC-bin→GGL-bin випадково перемішується, сила замикання EFT падає до 6–15 (з малими відмінностями між ядрами), тоді як базова сила замикання сягає 172–281. Це «падіння сигналу» виключає хибні переваги, спричинені числовою реалізацією, помилками одиниць або неправильною обробкою коваріації.

Рис. R1 | Негативний контроль: після shuffle-групування сигнал замикання істотно падає (побудовано з метрик Tab_Z1).
5.3 Зміст і межі результатів
Висновок цього дослідження такий: «за цього набору даних і цього протоколу поправка середньої гравітації EFT перевершує протестовану базову модель DM_RAZOR». Слід наголосити, що сторона DM використовує лише мінімальну NFW-базову модель із фіксованим співвідношенням c(M), без утворення ядра, несферичності, середовищних членів або складніших моделей зв’язку галактика–гало. Тому цей рукопис не стверджує, що виключає всі сімейства DM-моделей. Натомість він надає відтворювану контрольну базову модель, зосереджену на тесті замикання, для оцінювання того, чи можуть RC і GGL бути узгоджено пояснені тими самими міжданими параметрами й відображенням.
Щоб відповісти на це поширене занепокоєння, ми завершили незалежний проєкт розширення P1A (див. Додаток B). Не змінюючи спільне відображення RC-bin→GGL-bin або рамку аудиту, він посилює DM-базову модель у «стандартизований і придатний для аудиту» спосіб: окрім трьох одно-параметричних посилень (SCAT/AC/FB), він додає (i) ієрархічне розсіяння c–M + апріор маса–концентрація (DM_HIER_CMSCAT), (ii) одно-параметричний proxy баріонного feedback-ядра (DM_CORE1P) і (iii) nuisance-змінну shear-калібрування m з боку слабкого лінзування (DM_RAZOR_M), а також звітує про комбіновану модель DM_STD; EFT_BIN збережено як контрольне посилання.
• DM_RAZOR_SCAT (розсіяння c–M) — вводить параметр розсіяння концентрації між гало σ_logc, щоб перевірити, чи фіксоване c(M) систематично недооцінює пояснювальну силу DM;
• DM_RAZOR_AC (адіабатичне стискання) — використовує єдиний параметр α_AC для неперервної інтерполяції між «без стискання» і «стандартним стисканням», фіксуючи тенденцію баріонів стискати внутрішнє гало за мінімальної ціни;
• DM_RAZOR_FB (feedback/core) — використовує масштаб ядра (наприклад, log r_core), щоб описати, як утворення внутрішнього ядра пригнічує криві обертання, зберігаючи наближення NFW на масштабах слабкого лінзування.
Кількісний scoreboard P1A подано в Додатку B, таблиця B1 / рис. B1 (автоматично згенеровано з Tab_S1_P1A_scoreboard). У метриці замикання DM_RAZOR_FB дає невелике чисте покращення (122.21→129.45, +7.25), тоді як інші посилення вносять незначний або негативний внесок у силу замикання. З боку спільної підгонки додавання ієрархічного апріора розсіяння c–M (DM_HIER_CMSCAT) або комбінованої моделі (DM_STD) може суттєво покращити спільний logL, але не покращує силу замикання, що вказує: воно переважно додає гнучкість спільної підгонки, а не переносимість між пробами. Тому центральний висновок основного тексту слід читати так: за суворих обмежень спільного відображення й тесту замикання перевага EFT у міжданій узгодженості не виникає через вибір «надто слабкої базової моделі» на стороні DM. Релізний пакет P1A, що відповідає Додатку B (додаткові таблиці/рисунки та full_fit_runpack), буде включено як додаткові файли під тим самим Zenodo Concept DOI, що й full_fit_runpack для цієї статті: https://doi.org/10.5281/zenodo.18526286.
6 Робастність і контрольні експерименти
6.1 Сканування σ_int (Run-5)
Ми систематично скануємо власне RC-розсіяння σ_int і повторюємо спільну інференцію при кожному σ_int, обчислюючи ΔlogL_total відносно DM_RAZOR. Мінімальні/максимальні значення ΔlogL_total для кожної моделі в діапазоні сканування наведено в таблиці S1b.

Рис. R2 | Діапазон ΔlogL_total під час сканування σ_int (більше — краще).
6.2 Сканування R_min (Run-6)
Щоб перевірити вплив систематик у даних центральної області (таких як некруговий рух, роздільна здатність і недостатнє баріонне моделювання), ми застосовуємо порогові відсікання R_min до RC і повторюємо спільну інференцію. Перевага сімейства EFT залишається додатною та стабільною за масштабом у скануванні R_min.

Рис. R3 | Діапазон ΔlogL_total під час сканування R_min (більше — краще).
6.3 Сканування cov-shrink (Run-7)
Щоб перевірити невизначеність у GGL-коваріації, ми застосовуємо shrinkage до коваріаційної матриці кожного масового біна: C_α=(1−α)C+α·diag(C), і скануємо α. Результати показують, що перевага сімейства EFT нечутлива до цієї обробки.

Рис. R4 | Діапазон ΔlogL_total під час сканування cov-shrink (більше — краще).
6.4 Драбина абляції (Run-8)
У межах EFT_BIN ми виконуємо вкладені абляції: від мінімальної моделі (без вільних параметрів), через версії, що зберігають лише невелику кількість ступенів свободи, до повної моделі з 20-біновою амплітудою + глобальним масштабом. AICc/BIC показують, що повна модель EFT_BIN сильно потрібна даними.

Рис. R5 | Драбина абляції EFT_BIN (AICc; менше — краще).
6.5 Прогноз із відкладенням біна (Run-9)
Ми також запускаємо тест leave-one-bin-out (LOO): серед 4 масових бінів GGL щоразу відкладається один бін; інференція повторюється з використанням решти бінів (і всіх RC), після чого test log-likelihood оцінюється на відкладеному біні. Зведені метрики наведено в додатковій таблиці Tab_R3_leave_one_bin_out (продукт Run-9; шаблони файлових шляхів перелічено у списку ключових продуктів у розділі 8.2). Сімейство EFT залишається явно кращим за DM_RAZOR навіть у найгіршому відкладеному випадку.

Рис. R6 | LOO: розподіл log-likelihood для відкладеного біна (з продуктів Run-9).
6.6 Негативний контроль: shuffle RC-бінів (Run-10)
Run-10 випадково перегруповує 20 RC-бінів у 4×5 і повторно обчислює замикання, залишаючи RC-only постеріор незмінним. Результати показують, що порівняно з початковим відображенням shuffle істотно знижує як середній logL_true замикання, так і ΔlogL_closure (див. таблицю S1b і рис. R1), додатково підтримуючи інтерпретованість сигналу замикання.

Рис. R7 | Негативний контроль: shuffle-відображення спричиняє чітке падіння середнього logL_true замикання (з продуктів Run-10).
7 Простежуваність і аудит узгодженості (provenance)
Усі числові значення, наведені в цій статті, можуть бути простежені пункт за пунктом у суворих зведених таблицях і записах аудиту релізного архіву. Щоб зробити основний текст читабельнішим, повний ланцюг provenance (список тегів, аудиторські таблиці, список контрольних сум і метод перевірки) перенесено до Додатка A.
8 Відтворюваність і архів Zenodo
Заява про доступність даних і коду: дані кривих обертання SPARC і дані слабкого лінзування KiDS-1000, використані в цій статті, є публічними наборами даних. Звіт публікаційного рівня заархівовано на Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), а повний пакет відтворення заархівовано на Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). Детальні кроки виконання, середовище залежностей, інвентар архіву та інформацію про перевірку хешів подано в Додатку A; дизайн, run-теги й вихідні продукти стрес-тесту стандартизації DM-базової моделі (P1A) подано в Додатку B.
Під тим самим Concept DOI повного пакета відтворення (https://doi.org/10.5281/zenodo.18526286) ми надаємо дві відтворювані точки входу за сценарієм використання: • P1 (основний текст) full_fit_runpack: відтворює RC-only / closure / joint аналізи та сканування робастності для EFT проти DM_RAZOR і генерує матеріали основного тексту, включно з таблицями S1a/S1b і рис. S3/S4; • P1A (Додаток B) full_fit_runpack: відтворює стрес-тест стандартизації DM-базової моделі (SCAT/AC/FB + ієрархічний апріор розсіяння c–M + core1p + лінзувальний m + DM_STD, включно з контролем EFT_BIN) і генерує таблицю B1 та рис. B1 Додатка. Додаткові таблиці/рисунки P1A та full_fit_runpack буде включено як додаткові файли під тим самим Concept DOI, щоб зберегти єдину архівну точку входу.
9 Подяки та декларації
9.1 Подяки
Ми дякуємо командам SPARC і KiDS-1000 за надання публічних даних і документації, а також учасникам workflow реконструкції та аудиту цього проєкту.
9.2 Внесок автора
Guanglin Tu відповідав за концептуальну пропозицію, дизайн дослідження, інженерну реалізацію, кураторство даних, формальний аналіз, реалізацію й аудит workflow відтворюваності та написання рукопису.
9.3 Фінансування
Самофінансування автором, Guanglin Tu (без зовнішнього фінансування / без номера гранту).
9.4 Конфлікт інтересів
Автор, Guanglin Tu, афілійований із «EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (Китай)»; інших конфліктів інтересів не заявлено.
9.5 Допомога ШІ
OpenAI GPT-5.2 Pro і Gemini 3 Pro використовувалися для мовного полірування, структурного редагування та організації workflow відтворюваності. Вони не використовувалися для генерування або змінення даних, результатів, рисунків, таблиць чи коду, а також для генерування цитувань. Автор несе повну відповідальність за зміст і точність цитувань усього рукопису.
10 Література
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energy Filament Theory. Zenodo (open science repository) DOI: https://doi.org/10.5281/zenodo.18517411
Додаток A: деталі простежуваності та відтворюваності
Цей додаток узагальнює довгострокову архівну інформацію для простежуваності та відтворюваності, включно з run-тегами, результатами аудиту, інвентарями архіву та ключовими точками перевірки, щоб читачі могли за потреби перевірити й відтворити роботу.
A.1 Деталі простежуваності та аудиту
Щоб забезпечити довгострокову простежуваність, цей проєкт використовує теги з часовими мітками для кожного запуску та вихідного продукту й зберігає історичні продукти без перезапису. Ключові значення, наведені в цьому рукописі, походять із суворої компіляції (compile_tag=20260205_035929) і пройшли такі аудити узгодженості:
• Усі таблиці рівня етапу містять run_tag і stage-теги; скрипт суворої компіляції вибирає «повні та узгоджені» канонічні джерела таблиць із report/tables.
• Значення в Tab_Z1_master_summary і Tab_Z2_conclusion_highlights порівнюються пункт за пунктом із вибраними канонічними таблицями.
• Під час генерування PDF виконується аудит тегів для «посилань на теги таблиць/рисунків», щоб застарілі продукти не були змішані з актуальними.
Ключові теги (для локалізації всіх проміжних продуктів): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.
Результат аудиту узгодженості: Tab_AUDIT_checks_strict повідомляє pass=9, fail=0, skip=0 (деталі див. у релізному пакеті).
A.2 Кроки виконання відтворення та інвентар архіву
У цьому дослідженні прийнято систему відтворюваності, що складається зі «звіту публікаційного рівня + додатка таблиць/рисунків + повністю повторно запускного run-пакета». Читачі можуть безпосередньо звернутися до Tables & Figures Supplement, щоб перевірити всі табличні/графічні матеріали, процитовані в статті; щоб відтворити числові значення та ланцюг аудиту з нуля, вони можуть використати full_fit_runpack для завантаження даних і повторного запуску повного workflow. Після завершення вбудований у пакет скрипт порівняння з референтними таблицями можна використати для перевірки узгодженості табличних значень.
A.2.1 Швидкий старт відтворення (RUN_FULL, Windows PowerShell)
Цей розділ дає коротший шлях відтворення (Windows PowerShell). Для швидких перевірок читачам радять безпосередньо звертатися до Tables & Figures Supplement і перевіряти процитовані таблиці та рисунки пункт за пунктом. Для наскрізного відтворення та генерування всіх таблиць, рисунків і аудиторських продуктів використовуйте full_fit_runpack: дотримуйтеся README/ONE_PAGE_REPRO_CHECKLIST пакета, щоб запустити verify_checksums.ps1 і RUN_FULL.ps1 (рекомендовано Mode=full).
Архівний запис Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
Головні теги ланцюга для цієї статті: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442.
A.2.2 Архівні матеріали та ключові точки перевірки (пакети й checks)
Архів Zenodo надає три взаємодоповнювальні категорії матеріалів: (1) звіт публікаційного рівня (ця стаття, v1.1; включно з Додатком B: P1A стрес-тест стандартизації DM-базової моделі); (2) Tables & Figures Supplement (додаткові таблиці та рисунки, що охоплюють усі табличні/графічні матеріали, процитовані в цій статті, окремо для P1 і P1A); і (3) full_fit_runpack (повний пакет відтворення: завантажує дані з нуля й повторно запускає весь workflow, окремо для P1 і P1A). Пункти (1)–(2) підтримують швидке читання та незалежну перевірку; пункт (3) забезпечує повну наскрізну відтворюваність.
Категорія матеріалів | Назва файлу (приклад) | Призначення та позиціювання (рекомендований порядок використання) |
Звіт публікаційного рівня (китайською та англійською) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | Повний звіт заархівовано на Zenodo; основний текст подає ключові висновки та аудити робастності, а Додаток B подає P1A (стрес-тест стандартизації DM-базової моделі). |
Додаток таблиць і рисунків (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | Усі таблиці (CSV) та рисунки (PNG), процитовані в основному тексті, включно зі скриптами генерування та файлами тегів. |
Додаток таблиць і рисунків (P1A) | P1A_supplement_figs_tables_v1.zip | Усі таблиці та рисунки, процитовані в Додатку B (P1A), включно з Tab_S1_P1A_scoreboard і Fig_S1_P1A_scoreboard. |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | Повне наскрізне відтворення: завантажити дані з нуля та повторно запустити RC-only/closure/joint і сканування робастності. |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | Повне наскрізне відтворення (Додаток B): повторно запустити DM 7+1 + DM_STD (включно з контролем EFT_BIN) і згенерувати матеріали додатка; пакет містить скрипт порівняння з референтними таблицями для перевірки узгодженості табличних значень. |
Рекомендація щодо цитування: цитуючи цю статтю або супровідні матеріали відтворюваності, будь ласка, цитуйте Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).
Ключові продукти, які мають з’явитися і бути порівнюваними після відтворення, включають:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (зведення замикання)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (зведення спільної підгонки)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (сканування σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (сканування R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (сканування cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (абляція)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (негативний контроль)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (сувора головна таблиця; відповідає таблицям S1a/S1b і значенням основного тексту)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (PDF-пакет публікаційного рівня; може використовуватися для швидкого перегляду й цитування)
Додаток B: P1A — стрес-тест стандартизації DM-базової моделі (DM 7+1 + DM_STD; з EFT-контролем)
Цей додаток документує проєкт розширення (P1A) для «стрес-тестування стандартизації DM-базової моделі», узгоджений із протоколом замикання в основному тексті. Його роль полягає в оновленні мінімальної DM_RAZOR-базової моделі, використаної в основному тексті (NFW + фіксоване c–M, без розсіяння / без стискання / без ядра), до набору DM-базових моделей, ближчого до астрофізичної практики та стійкішого до поширеної критики, без введення великої кількості ступенів свободи й без зміни спільного відображення RC-bin→GGL-bin або рамки аудиту. P1A охоплює й розширює попередній тригілковий стрес-тест: він зберігає SCAT/AC/FB, додаючи ієрархічне розсіяння c–M + апріор, одно-параметричний proxy ядра та nuisance m shear-калібрування з боку лінзування; він також надає комбіновану модель DM_STD. EFT_BIN збережено як контрольне посилання.
Додаткова примітка: сили замикання та пов’язані значення в Додатку B (P1A) використовують більший бюджет Monte Carlo (наприклад, ndraw=400, nperm=24), ніж швидкий бюджет, використаний в основному тексті для охоплення повного сімейства ядер EFT (наприклад, ndraw=60, nperm=12). Тому абсолютні значення можуть демонструвати sampling drift рівня O(10). Однак порівняння модель-до-моделі в межах того самого бюджету/таблиці є справедливими, а знак і масштаб переваги залишаються стабільними між бюджетами.
B.1 Мета та позиціювання (чому P1A і чому як додаток)
P1A не намагається вичерпати всі можливі вибори моделювання ΛCDM-гало (такі як несферичність, залежність від середовища, складні зв’язки галактика–гало або високорозмірна баріонна фізика). Натомість P1A дотримується принципу «низькорозмірний, придатний для аудиту, відтворюваний»: кожен модуль посилення вводить лише ≤1 ключовий ефективний параметр і залишається під трьома жорсткими обмеженнями цієї статті:
(i) Реєстр параметрів: кожен новий параметр має бути явно записаний і звітований разом з інформаційними критеріями (AICc/BIC);
(ii) Спільне відображення: та сама карта групування RC-bin→GGL-bin і надалі використовується; «налаштовувати відображення» окремо для одного набору даних не дозволено;
(iii) Тест замикання: будь-яке посилення має показати справжній виграш у переносному прогнозі RC→GGL, а не лише кращу RC-only підгонку.
B.2 DM 7+1 + DM_STD: визначення модулів, параметри та вхід до спільного постеріора
Як незалежний runpack, P1A надає 8 DM-робочих просторів (DM 7+1) плюс 1 EFT-контроль: починаючи з DM_RAZOR як бази, він будує три legacy одно-параметричні посилення (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), додає три стандартніші захисні модулі (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), а потім надає комбіновану модель DM_STD. Спільна мета цих модулів — охопити три найпоширеніші класи критики з якомога меншим збільшенням розмірності: (a) як розсіяння c–M і апріори входять в ієрархічну модель; (b) чи можна головний ефект баріонного feedback захопити одно-параметричним proxy ядра; і (c) чи можуть ключові систематики з боку лінзування бути помилково прийняті за фізичний сигнал.
Робочий простір | dm_model | Нові параметри (≤1) | Фізична мотивація (ядро) | Принцип реалізації (зручний для аудиту) |
|---|---|---|---|---|
DM_RAZOR | NFW (фіксоване c–M, без розсіяння) | — | Мінімальна, придатна для аудиту базова модель ΛCDM-гало; використовується для суворого порівняння з EFT | Спільне відображення зафіксоване; суворий реєстр параметрів; використовується як базова модель лише для відносного порівняння |
DM_RAZOR_SCAT | NFW + розсіяння c–M (legacy) | σ_logc | Співвідношення c–M має розсіяння; апроксимується одно-параметричним логнормальним розсіянням | ≤1 новий параметр; спільне відображення збережено; виграш у замиканні використовується як критерій прийняття |
DM_RAZOR_AC | NFW + адіабатичне стискання (legacy) | α_AC | Баріонне падіння може спричинити адіабатичне стискання гало; апроксимується одно-параметричною силою | ≤1 новий параметр; відображення незмінне; звітувати зміни AICc/BIC і виграш замикання |
DM_RAZOR_FB | NFW + feedback-ядро (legacy) | log r_core | Feedback може сформувати ядро у внутрішній області; апроксимується одно-параметричним масштабом ядра | ≤1 новий параметр; той самий протокол замикання/негативного контролю; покращення RC-only не є єдиною метою |
DM_HIER_CMSCAT | Ієрархічне розсіяння c–M + апріор | σ_logc (hier) | Стандартніша ієрархічна схема c_i∼logN(c(M_i),σ_logc); впливає на спільний постеріор як RC, так і GGL | Явний апріор; латентні c_i маргіналізовані; усе ще низькорозмірно й придатно для аудиту |
DM_CORE1P | Одно-параметричний proxy ядра (натхненний coreNFW/DC14) | log r_core | Використовує одно-параметричний proxy ядра для головного ефекту баріонного feedback, уникаючи високорозмірних деталей зореутворення | Посилається на стандартну літературу; ≤1 новий параметр; прив’язано до тесту замикання |
DM_RAZOR_M | NFW + nuisance shear-калібрування лінзування | m_shear (GGL) | Поглинає ключову систематику слабкого лінзування як ефективний параметр, зменшуючи ризик сплутати систематику з фізикою | Nuisance явно записано; не може зворотно впливати на RC; результати оцінюються переважно за робастністю замикання |
DM_STD | Стандартизована DM-базова модель (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Включає три найпоширеніші класи критики в усе ще низькорозмірній стандартній базовій моделі | Звітуються реєстр параметрів + інформаційні критерії; замикання є основною метрикою; використовується як найсильніший захисний контроль DM |
Примітка: наведені вище назви параметрів відповідають інженерній реалізації (наприклад, σ_logc, α_AC, log r_core і m_shear). Дизайнерський фокус P1A — «зробити DM-базову модель дещо сильнішою, зберігаючи її придатною для аудиту», а не перетворити сторону DM на неконтрольований високорозмірний фітер. Зокрема, DM_HIER_CMSCAT вводить розсіяння c–M ієрархічно: концентрації c_i кожного гало задається логнормальне розсіяння навколо c(M_i), обмежене глобальним σ_logc і апріором c(M); ця ієрархічна структура впливає на спільний постеріор як RC, так і GGL.
B.3 Статистичний протокол і продуктові конвенції, узгоджені з основним текстом
P1A повторно використовує всі продукти даних, спільне відображення та рамку аудиту з основного тексту. Порядок виконання й продуктові конвенції залишаються узгодженими:
(1) Run‑1: RC-only інференція (виходи posterior_samples.npz і metrics.json);
(2) Run‑2: тест замикання RC→GGL (виходи closure_summary.json і переставлена базова модель);
(3) Run‑3: спільна підгонка RC+GGL (вихід joint_summary.json).
Усі процитовані числа походять з автоматично скомпільованої таблиці (Tab_S1_P1A_scoreboard) і можуть бути перевірені після повторного запуску повного workflow P1A за допомогою скрипта порівняння з референтними таблицями, вбудованого в P1A full_fit_runpack.
B.4 Основні результати, точки входу до таблиць/рисунків і план архіву (той самий DOI)
Цей розділ подає ключові кількісні висновки P1A. Таблиця B1 узагальнює ключові метрики для RC-only, замикання RC→GGL і спільної підгонки RC+GGL (у дужках наведено різниці відносно базової моделі DM_RAZOR). Сила замикання визначається як ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (більше — краще). Рис. B1 візуалізує той самий scoreboard. Головні пункти такі:
• Серед трьох legacy-гілок лише DM_RAZOR_FB (feedback/core) дає невелике чисте покращення сили замикання: 122.21→129.45 (+7.25); SCAT і AC не дають чистого покращення;
• Новододані DM_HIER_CMSCAT і DM_RAZOR_M мають дуже малі ефекти (~0) на силу замикання, і DM_CORE1P так само не показує значного чистого покращення;
• Комбінована модель DM_STD може суттєво покращити спільний logL (ближче до оптимуму спільної підгонки), але її сила замикання зменшується, що вказує: її виграш переважно походить від гнучкості спільної підгонки, а не від переносимості між пробами;
• Як контроль EFT_BIN усе ще зберігає чітку перевагу і в силі замикання, і в спільній підгонці. Отже, головний висновок є робастним щодо введення «сильнішої DM-базової моделі + лінзувальної nuisance-змінної».
Для прямого порівняння з результатами основного тексту таблиці S1a–S1b підсумовують суворе порівняння між сімейством EFT і DM_RAZOR: моделі EFT покращують спільну підгонку на ΔlogL_total≈1155–1337 відносно DM_RAZOR і досягають ΔlogL_closure=172–281 у тесті замикання. P1A лише створює «жорсткіший контроль» на стороні DM; його мета — зменшити занепокоєння на кшталт «солом’яної базової моделі» або «систематики як фізика», а не замінити головне порівняння.
Таблиця B1 | Scoreboard P1A (більше — краще; дужки вказують різниці відносно базової моделі DM_RAZOR).
Гілка моделі (робочий простір) | Δk | Найкращий RC-only logL_RC (Δ) | Сила замикання ΔlogL_closure (Δ) | Найкращий спільний logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Рис. B1 | Scoreboard P1A: замикання та спільний ΔlogL відносно базової моделі (більше — краще).

Приклад тегів для завершеної серії запусків, що відповідає цьому додатку, наведено нижче (використовується для локалізації проміжних продуктів P1A і таблиць/рисунків):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.
B.5 Запропоноване цитування (примітка до цитування додатка)
Коли читачам потрібно цитувати «стрес-тест стандартизації DM-базової моделі» на додаток до головних висновків статті, рекомендується цитувати головний висновок разом із такою приміткою: “See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”