Пояснення звіту P1

Від кривих обертання до слабкого лінзування: перевірка середньої гравітаційної відповіді EFT

Публічний пояснювальний посібник на основі P1_RC_GGL: A Strict Closure Test of Galaxy Dynamics and Weak Lensing (v1.1)

Оригінальний звіт: Guanglin Tu | Версійна основа: P1 v1.1 | Редакційний статус: публічний пояснювальний чернетковий текст / не рецензована наукова стаття
Пов’язані архіви: DOI звіту 10.5281/zenodo.18526334 | DOI пакета відтворення 10.5281/zenodo.18526286

Ознайомтеся з оригінальним звітом з оцінювання:

1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc

2. Gemini: https://gemini.google.com/share/773ec96d75a0

3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04

4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46

5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm

6. Doubao: https://www.doubao.com/thread/w166b207d7345e46a

Примітка до читання

Це пояснювальна версія, а не окремий академічний звіт. Вона ґрунтується на оригінальному звіті P1, зберігає ключові рисунки й таблиці та додає пояснення простою мовою щодо того, що означає кожен великий крок.

Цей посібник пояснює лише те, що P1 висновує за своїми визначеними наборами даних, реєстром параметрів і статистичним протоколом: у спільному тесті кривих обертання галактик (RC) і слабкого лінзування галактика–галактика (GGL) модель середньої гравітаційної відповіді EFT явно перевершує мінімальну базову лінію DM_RAZOR, протестовану тут.

Цей посібник не тлумачить P1 як твердження, що «темну матерію спростовано». P1 — лише перший крок експериментів серії P. Він тестує один спостережуваний шар EFT — «середній гравітаційний базис», а не весь зміст повного каркаса EFT.

0 | Зрозуміти P1 за п’ять хвилин: що саме робить цей тест?

P1 можна уявити як тест узгодженості між різними спостережними зондами. Він не просто питає, чи може модель припасувати один набір даних. Натомість він ставить на один аудиторський стіл два дуже різні гравітаційні зчитування: криві обертання (RC) зчитують динаміку всередині галактичних дисків, а слабке лінзування галактика–галактика (GGL) зчитує проєктовану гравітаційну відповідь на більших масштабах.

RC схожа на спідометр: вона показує, з якою швидкістю газ і зорі обертаються на різних радіусах у галактичному диску.
GGL схоже на ваги: вимірюючи, як передні галактики трохи викривляють світло від фонових галактик, воно виводить середній розподіл гравітації/маси навколо галактик на більших масштабах.
Центральне питання P1 таке: чи може одна й та сама модель спершу вивчити закономірність із RC, потім перенести її на GGL і все ще залишатися осмисленою?

P1 одним реченням

P1 піднімає планку з питання «чи добре це припасовує один зонд?» до питання «чи замикається це між зондами?» Модель із більшою ймовірністю вловила гравітаційну структуру, спільну для RC і GGL, лише якщо вона добре працює за правильного відображення, а після перемішування відображення сигнал обвалюється.

Таблиця 0 | Основні числа P1 і спосіб їх читання

Метрика	Читання в P1 / P1A	Значення простою мовою
Спільне припасування ΔlogL_total	В основному текстовому порівнянні EFT на 1155–1337 вище за DM_RAZOR	Різниця загальної оцінки між двома наборами даних; більше означає кращу загальну пояснювальну силу.
Сила замикання ΔlogL_closure	В основному текстовому порівнянні EFT має 172–281, тоді як DM_RAZOR має 127	Здатність прогнозувати GGL після висновку лише з RC; більше означає сильнішу самоузгодженість між зондами.
Перемішування негативного контролю	Після перемішування RC-bin→GGL-bin сигнал замикання EFT падає до 6–23	Якщо правильну відповідність зруйновано, перевага має зникнути; що різкіший обвал, то краще це виключає хибний сигнал.
Багатомодельний DM-стрес-тест P1A	DM 7+1 + DM_STD, з EFT_BIN як порівнянням	P1A не дивиться лише на мінімальну базову лінію DM_RAZOR. Він поміщає кілька низьковимірних, придатних до аудиту гілок DM-посилення в той самий протокол замикання.

1 | Навіщо потрібен P1? Де застрягла космологія галактичних масштабів?

Проблеми галактичного масштабу залишаються складними, бо «потреба в додатковій гравітації/масі» не є лише явищем кривих обертання. Багато спостережень показують тісний зв’язок між видимою баріонною речовиною в галактиках і реальними динамічними/лінзувальними зчитуваннями. Для шляху темної матерії це означає, що темні гало, баріонний зворотний зв’язок, історію формування галактик і спостережні систематики треба узгоджувати з великою точністю. Для напрямів гравітації без темної матерії це означає, що модель не може просто добре виглядати на RC; вона має також витримувати слабке лінзування, популяційні масштабні співвідношення й негативні контролі.

Саме це і є мотивацією P1. Він не починає з твердження «темна матерія неправильна» або «EFT має бути правильною». Він виносить на аудит одну перевірну тезу: чи може середня гравітаційна відповідь EFT залишити відтворюваний і переносний сигнал у замиканні між зондами RC→GGL?

Контекст зовнішньої літератури: чому вікно RC+GGL важливе

Радіальне співвідношення прискорення (RAR), запропоноване McGaugh, Lelli і Schombert у 2016 році, показує тісну кореляцію з малим розкидом між спостережуваним прискоренням, яке простежують криві обертання, і прискоренням, передбаченим із баріонної речовини. Це робить «зв’язок баріони–гравітаційна відповідь» неминучим для теорії галактичного масштабу.

Brouwer et al. (2021) використали слабке лінзування KiDS-1000, щоб розширити RAR до нижчих прискорень і більших радіусів, порівнюючи MOND, emergent gravity Verlinde і моделі LambdaCDM. Вони також зазначили, що відмінності між ранніми й пізніми типами галактик, газові гало і зв’язок галактика–гало залишаються ключовими пояснювальними питаннями.

Mistele et al. (2024) далі використали слабке лінзування, щоб вивести криві кругової швидкості для ізольованих галактик, повідомивши про відсутність чіткого спадання до кількох сотень kpc і навіть приблизно до 1 Mpc, у згоді з BTFR. Це показує, що слабке лінзування стає важливим зовнішнім зчитуванням для перевірки гравітаційної відповіді на галактичних масштабах.

Тому цінність P1 не в тому, що він нібито «першим обговорює RC і GGL разом». Його цінність у тому, що він поміщає їх у придатний до аудиту протокол, побудований із фіксованого відображення, реєстру параметрів, замикання RC-only→GGL, негативних контролів із перемішуванням і багатомодельних DM-стрес-тестів P1A.

2 | Що означає EFT у P1? Це не Effective Field Theory

Тут EFT означає Теорію Нитки Енергії (Energy Filament Theory, EFT), а не ефективну теорію поля, яку часто називають так само у фізиці. У технічному звіті P1 EFT використовується стримано: вона не входить у порівняння як завершена повна теорія, а спершу стискається до спостережуваної, придатної для припасування й фальсифікованої параметризації «середньої гравітаційної відповіді».

Простіше кажучи, P1 не починає з обговорення кожного мікроскопічного джерела додаткової гравітації і не намагається одразу довести весь каркас EFT. Він ставить вужче й жорсткіше питання: якщо на галактичних масштабах існує певна середня додаткова гравітаційна відповідь, чи може вона спершу пояснити RC, а потім перейти до прогнозування GGL?

Яку частину EFT тестує P1?

P1 націлений на «середній гравітаційний базис»: статистично стабільний середній внесок, який може переноситися між вибірками.

P1 ще не опрацьовує «стохастичний/шумовий базис»: випадкові члени, індивідуальні відмінності або додатковий розкид, які можуть вводити глибші мікроскопічні флуктуаційні процеси.

P1 також не розглядає повний мікроскопічний механізм, поширеність, час життя або глобальні космологічні обмеження. Це перший крок експериментів серії P, а не остаточний вердикт.

3 | План серії P1: чому починати із «середнього базису»?

Серію P можна розуміти як програму спостережного зворотного зчитування EFT. Вона не викладає всі твердження одразу; натомість ізолює ту частину, яку найпростіше перевірити на відкритих даних. Стратегія P1 полягає в тому, щоб спершу протестувати середній член: якщо середня гравітаційна відповідь навіть не замикається від RC до GGL, то розмова про складніші шумові члени або мікроскопічні механізми не має належної точки входу.

Таблиця 1 | Пошарове позиціонування серії P

Шар	Поставлене питання	Роль у P1
P1	Чи може середня гравітаційна відповідь замкнутися в RC→GGL?	Головне питання цього звіту
P1A	Якщо сторону DM посилити, чи залишиться висновок стабільним?	Додаток B: стрес-тест DM 7+1 + DM_STD
Подальша робота серії P	Чи можна розширити протокол на більше даних, більше зондів і складніші систематики?	Напрям для майбутньої роботи
Питання глибшого рівня	Як поєднуються середній член, шумовий член і мікроскопічний механізм?	Поза сферою висновків P1

4 | Які це дані? Що кажуть RC і GGL?

4.1 Криві обертання (RC): «вимірювач швидкості» всередині галактичних дисків

Криві обертання фіксують, як швидко газ і зорі обертаються навколо центру галактики на різних радіусах. Що швидше обертання, то сильніша доцентрова сила потрібна на цьому радіусі — а отже, то сильніша ефективна гравітація. P1 використовує базу SPARC з попередньою обробкою, що охоплює 104 галактики й 2 295 точок швидкості, поділених на 20 RC-бінів.

4.2 Слабке лінзування (GGL): «гравітаційні ваги» більшого масштабу

Слабке лінзування галактика–галактика вимірює, як передні галактики трохи викривляють світло від фонових галактик. Воно відповідає проєктованій гравітаційній відповіді на більших, гало-масштабних радіусах і не залежить від деталей газової динаміки всередині галактики. P1 використовує відкриті дані GGL з KiDS-1000 / Brouwer et al. (2021): 4 біни зоряної маси, 15 радіальних точок на бін, загалом 60 точок даних, із використанням повної коваріації.

4.3 Фіксоване відображення: чому 20 RC-бінів → 4 GGL-біни має значення

P1 з’єднує 20 RC-бінів із 4 GGL-бінами за фіксованим правилом: кожному GGL-біну відповідають 5 RC-бінів, об’єднаних середнім із вагами за кількістю галактик. Це відображення залишається незмінним для всіх моделей і працює як жорстке обмеження для тесту замикання та справедливого порівняння.

Чому не налаштовувати відображення після факту?

Якби можна було постфактум вибрати, «які RC-біни відповідають яким GGL-бінам», модель могла б виготовити замикання, переставивши відповідність. P1 заздалегідь фіксує відображення 20→4 і навмисно ламає його негативним контролем із перемішуванням саме для того, щоб оцінити, чи справді сигнал замикання залежить від фізично розумної відповідності.

5 | Моделі й методи: що саме порівнює P1?

5.1 Сторона EFT: низьковимірна середня гравітаційна відповідь

На стороні EFT для опису середньої гравітаційної відповіді використовується низьковимірний додатковий член швидкості. Форму додаткового члена контролює безрозмірна ядерна функція f(r/ℓ), де ℓ — глобальний масштаб, а амплітуда задається за RC-бінами. Різні ядра представляють різні початкові нахили, швидкості переходу та далекодійні хвости й використовуються для стрес-тестів робастності.

5.2 Сторона DM: основне порівняння в тексті й додаток P1A треба читати окремо

В основному текстовому порівнянні DM_RAZOR є мінімізованою, придатною до аудиту базовою лінією NFW: вона використовує фіксоване співвідношення c–M і не включає розкид між гало, адіабатичне стискання, ядра зворотного зв’язку, несферичність або середовищні члени. Сила такої конструкції — контрольовані ступені свободи й легка відтворюваність; її слабкість — у тому, що вона не може представляти кожну модель LambdaCDM або гало темної матерії.

Тому в додатку B (P1A) сторону DM перетворено на набір «стандартизованих стрес-тестів». Не змінюючи спільного відображення або протоколу замикання, P1A поступово додає низьковимірні гілки посилення, зокрема SCAT, AC, FB, HIER_CMSCAT, CORE1P, лінзувальний m і комбіновану базову лінію DM_STD, зберігаючи EFT_BIN як порівняння. Коротко: P1A не є порівнянням лише з однією мінімальною базовою лінією DM; він вимірює набір поширених, придатних до аудиту DM-механізмів тією самою «лінійкою замикання».

Точне формулювання висновку, використане тут

Основний текст: сімейство EFT істотно перевершує мінімальний DM_RAZOR в основному порівнянні.

Додаток B / P1A: за кількох низьковимірних, придатних до аудиту гілок DM-посилення і стрес-тесту DM_STD деякі спільні DM-припасування поліпшуються, але сила замикання не усуває перевагу EFT_BIN.

Тому найбезпечніше твердження таке: у межах даних, відображення, реєстру параметрів і протоколу замикання P1/P1A середня гравітаційна відповідь EFT демонструє сильнішу міждану узгодженість; це не те саме, що виключення всіх моделей темної матерії.

5.3 Тест замикання: найважливіший експериментальний синтаксис P1

1. Підігнати модель лише за RC, щоб отримати набір апостеріорних зразків RC-only.

2. Не переналаштовувати за GGL; використати апостеріор RC напряму для прогнозування GGL.

3. Використати повну коваріацію, щоб обчислити оцінку прогнозу GGL за правильним відображенням, logL_true.

4. Випадково переставити відповідність RC-bin→GGL-bin, щоб обчислити оцінку негативного контролю, logL_perm.

5. Відняти одне від одного, щоб отримати силу замикання: ΔlogL_closure = <logL_true> − <logL_perm>.

Аналогія простою мовою

Тест замикання схожий на повторний перехресний іспит. Модель спершу вивчає закономірності в аудиторії RC, а потім відповідає в аудиторії GGL. Якщо вона вивчила спільне правило, а не локальний трюк, вона має добре відповідати й після зміни аудиторії; якщо відповідність між аудиторіями навмисно перемішати, перевага має зникнути.

5.4 Перед читанням технічних таблиць: чотири точки входу

Таблиця 5.4 | Шлях читання наступного набору широких технічних таблиць

Точка входу	На що дивитися	Чому це важливо
Таблиця S1a	Загальна оцінка спільного припасування RC+GGL	Відповідає: «Коли два набори даних розглядаються разом, чиє загальне пояснення сильніше?»
Таблиця S1b	Сила замикання, перемішування і сканування робастності	Відповідає: «Чи може те, що вивчено з RC, перенестися на GGL?»
Таблиця B0	Визначення кількох гілок DM-посилення в P1A	Не дає звести P1 до «лише порівняння з мінімальним DM_RAZOR».
Таблиця B1	Табло замикання і спільного припасування P1A	Перевіряє, чи зникає перевага замикання після посилення DM.

Примітка щодо верстки

Альбомні сторінки починаються на наступній сторінці, щоб широкі таблиці з оригінального звіту можна було зберегти цілими, не видаляючи стовпці і не стискаючи їх до нечитабельності. Основний текст уже дав читання простою мовою; альбомні технічні таблиці призначені для читачів, яким потрібно перевірити значення і гілки моделей.

Рисунок 0.1 | Робочий процес тесту замикання P1 в одній схемі

Примітка: верхній ланцюг — це «тест замикання» (припасувати лише RC → використати апостеріор RC для прогнозу GGL); нижній ланцюг — це «спільне припасування» (оцінювати RC+GGL разом). Праворуч істинне відображення порівнюється з перемішаним відображенням, щоб отримати силу замикання ΔlogL.

6 | Ключові технічні таблиці: основні таблиці з оригінального звіту та таблиці P1A

Таблиця S1a | Основні метрики порівняння спільного припасування (RC+GGL, Strict; збережено з оригінального звіту)

Модель (робочий простір)	Ядро W	k	Спільне logL_total (найкраще)	ΔlogL_total проти DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

Таблиця S1b | Метрики замикання й робастності (Strict; збережено з оригінального звіту)

Модель (робочий простір)	ΔlogL замикання (true-perm)	ΔlogL після перемішування негативного контролю	Діапазон ΔlogL у скануванні σ_int	Діапазон ΔlogL у скануванні R_min	Діапазон ΔlogL у скануванні cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

Таблиця B0 | Визначення гілок посилення DM у P1A (збережено з додатка B оригінального звіту)

Робочий простір	dm_model	Новий параметр (≤1)	Фізична мотивація (ядро)	Принцип реалізації (придатний до аудиту)
DM_RAZOR	NFW (фіксоване c–M, без розкиду)	—	Мінімальна, придатна до аудиту базова лінія гало LambdaCDM; використовується як суворе порівняння з EFT	Фіксоване спільне відображення; суворий реєстр параметрів; використовується лише як базова лінія відносного порівняння
DM_RAZOR_SCAT	NFW + розкид c–M(legacy)	σ_logc	Співвідношення c–M має розкид; апроксимується однопараметричним логнормальним розкидом	≤1 новий параметр; усе ще використовує спільне відображення; приріст замикання є критерієм прийняття
DM_RAZOR_AC	NFW + адіабатичне стискання(legacy)	α_AC	Баріонне падіння всередину може спричиняти адіабатичне стискання гало; апроксимується однопараметричною силою	≤1 новий параметр; відображення незмінне; повідомляє зміни AICc/BIC і приріст замикання
DM_RAZOR_FB	NFW + ядро зворотного зв’язку(legacy)	log r_core	Зворотний зв’язок може створити внутрішнє ядро; апроксимується однопараметричним масштабом ядра	≤1 новий параметр; те саме обрамлення замикання/негативного контролю; поліпшення RC-only не є єдиною метою
DM_HIER_CMSCAT	Ієрархічний розкид c–M + пріор	σ_logc(hier)	Стандартніший ієрархічний c_i∼logN(c(M_i),σ_logc); впливає на спільний апостеріор RC і GGL	Явний пріор; латентні c_i маргіналізуються; залишається низьковимірним і придатним до аудиту
DM_CORE1P	Однопараметричний проксі ядра (натхненний coreNFW/DC14)	log r_core	Використовує однопараметричний проксі ядра для головного ефекту баріонного зворотного зв’язку, уникаючи високовимірних деталей зореутворення	Посилається на стандартну літературу; ≤1 новий параметр; прив’язаний до тесту замикання
DM_RAZOR_M	NFW + nuisance-калібрування shear-лінзування	m_shear(GGL)	Поглинає ключову систематику на стороні слабкого лінзування ефективним параметром, зменшуючи ризик трактувати систематики як фізику	Nuisance явно записано; йому не дозволено зворотно впливати на RC; результати оцінюються переважно за робастністю замикання
DM_STD	Стандартизована базова лінія DM (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	Об’єднує три найпоширеніші заперечення в одну все ще низьковимірну стандартизовану базову лінію	Разом повідомляє реєстр параметрів і інформаційні критерії; замикання є головною метрикою; використовується як найсильніше захисне порівняння DM

Таблиця B1 | Табло P1A (більше — краще; збережено з додатка B оригінального звіту)

Гілка моделі (робочий простір)	Δk	Найкраще RC-only logL_RC (Δ)	Сила замикання ΔlogL_closure (Δ)	Найкраще спільне logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

Як читати таблицю B1 (табло P1A)

• Δk: новододані ступені свободи (більше означає складнішу модель; складніша не означає автоматично краща).

• Зосередьтеся на двох стовпцях: сила замикання ΔlogL_closure(Δ) (більше означає кращу самоузгодженість перенесення) і найкраще спільне logL_total(Δ) (сумарна оцінка спільного припасування).

• Значення в дужках, (Δ), є різницею відносно DM_RAZOR, що полегшує пряме порівняння.

• Головне питання цієї таблиці — чи зникає перевага замикання після того, як базову лінію DM «розумно посилено».

• Порада для читання: DM_STD помітно поліпшує спільну оцінку, але його сила замикання падає; EFT_BIN усе ще залишається вищим за силою замикання.

Одним реченням: у цьому низьковимірному, придатному до аудиту наборі DM-посилень поліпшення спільного припасування не автоматично створює сильніше замикання; замикання, тобто переносність, залишається ключовим критерієм.

7 | Як слід читати основні результати?

7.1 Спільне припасування: якщо дивитися на обидва набори даних, оцінка основного порівняння EFT вища

Таблиця S1a і рисунок S4 показують, що за тих самих даних, того самого спільного відображення і приблизно того самого масштабу параметрів сімейство EFT має спільне ΔlogL_total на рівні 1155–1337 відносно DM_RAZOR. Загальний читач може розуміти це так: за одним і тим самим правилом оцінювання, застосованим до RC і GGL разом, моделі основного порівняння EFT отримують вищу загальну оцінку.

7.2 Тест замикання: головний акцент P1 — «переносність»

Висока сила замикання означає, що параметри, виведені лише з RC, можуть краще прогнозувати GGL без повторного погляду на GGL. У звіті P1 ΔlogL_closure для EFT становить 172–281, тоді як для DM_RAZOR — 127. Цей результат важливіший за твердження «кожна модель добре припасовує свої дані», бо він обмежує свободу моделі на другому наборі даних.

7.3 Негативний контроль: чому «обвал сигналу» — це добре?

Після того як P1 випадково перемішує відповідність групування RC-bin→GGL-bin, сигнал замикання EFT падає до діапазону 6–23. Для загального читача цей крок схожий на перевірку проти шахрайства: якщо перевага замикання була б лише породжена кодом, одиницями, обробкою коваріації або випадковістю припасування, вона могла б зберегтися навіть за перемішаної відповідності. Натомість реальна перевага обвалюється, показуючи, що вона залежить від правильного відображення.

Рисунок S3 | Сила замикання (більше — краще): середня перевага лог-правдоподібності для прогнозу RC-only → GGL.

Як читати цей рисунок

Цей рисунок є ядром P1. Чим вищий стовпчик, тим краще інформація, вивчена з RC, переноситься на GGL.

Сімейство EFT загалом вище за DM_RAZOR, що вказує на сильніше міжзондове замикання EFT в експерименті «спершу вивчи RC, потім прогнозуй GGL».

Рисунок S4 | Перевага спільного припасування (більше — краще): найкраще logL_total для RC+GGL відносно DM_RAZOR.

Як читати цей рисунок

Цей рисунок показує загальну оцінку після поєднання RC і GGL.

Усі моделі EFT значно вище 0, що вказує: перевага EFT в основному порівнянні не є локальним ефектом однієї точки, а є загальним патерном у спільному аналізі.

Рисунок R1 | Негативний контроль: сигнал замикання різко падає після перемішування групування.

Як читати цей рисунок

Цей рисунок показує, що коли правильний біновий зв’язок RC↔GGL порушено, сигнал замикання різко падає.

Це робить результат P1 більш схожим на справжню узгодженість у відображенні між даними, а не на числовий збіг, який можна отримати за довільних відображень.

8 | Робастність і контролі: як P1 уникає статусу «просто красивої припасування»?

Найпростіший виклик для технічного звіту — запитати, чи походить перевага з одного налаштування шуму, одного відсікання даних центральної області, одного способу обробки коваріації або перенавчання. P1 відповідає на це кількома стрес-тестами.

Таблиця 2 | Як читати тести робастності P1 і негативні контролі

Тест	Яке занепокоєння він намагається виключити	Як його читати
Сканування σ_int	Якщо RC містить додатковий невідомий розкид, чи залишається висновок стабільним?	Після послаблення похибок RC ранжування EFT і масштаб переваги залишаються стабільними.
Сканування R_min	Якщо центральним областям галактик не можна повністю довіряти, чи залишається висновок стабільним?	Після обрізання центральних областей EFT все ще зберігає позитивну перевагу.
Сканування cov-shrink	Якщо оцінка коваріації GGL невизначена, чи залишається висновок стабільним?	Після стискання коваріації до діагоналі перевага не є чутливою.
Драбина абляції	Чи покладається EFT на зайву складність, щоб силоміць отримати припасування?	Інформаційні критерії підтримують повний EFT_BIN.
LOO-прогноз з утриманням	Чи пояснює модель лише дані, які вже бачила?	Після утримання одного GGL-біна модель усе ще демонструє сильну здатність до узагальнення.
Перемішування RC-бінів	Чи походить замикання з істинного відображення?	Замикання падає після перемішування групування, підтримуючи залежність від відображення.

Рисунок R2 | Діапазон ΔlogL_total у скануванні σ_int (більше — краще).

Як читати цей рисунок

Перевіряє, чи зберігається лідерство EFT після змін у припущеному внутрішньому розкиді RC.

Рисунок R3 | Діапазон ΔlogL_total у скануванні R_min (більше — краще).

Як читати цей рисунок

Перевіряє, чи залишається перевага EFT стабільною після обрізання складних центральних областей.

Рисунок R4 | Діапазон ΔlogL_total у скануванні cov-shrink (більше — краще).

Як читати цей рисунок

Перевіряє, чи чутливе ранжування до змін в обробці коваріації слабкого лінзування.

Рисунок R5 | Драбина абляції EFT_BIN (AICc, менше — краще).

Як читати цей рисунок

Перевіряє, чи потрібна повна модель EFT_BIN для пояснення даних, а не просто додає зайві параметри.

Рисунок R6 | LOO: розподіл лог-правдоподібності для утриманих бінів.

Як читати цей рисунок

Перевіряє, чи модель усе ще має прогнозну продуктивність на небачених GGL-бінах.

Рисунок R7 | Негативний контроль: перемішане відображення спричиняє чітке падіння середнього logL_true замикання.

Як читати цей рисунок

Додатково показує з погляду середнього logL_true, що замикання залежить від правильного міжданого відображення.

9 | P1A: чому «кілька DM-моделей у додатку» є ключовим виправленням

Цей розділ не питає: «Чи EFT перемогла лише одну мінімальну базову лінію DM_RAZOR?» Він питає, чи змінюються висновки тесту замикання і спільного припасування, коли базову лінію DM посилюють у межах низьковимірного, відтворюваного й чітко задокументованого реєстру параметрів (P1A). Інакше кажучи, P1A прагне зменшити заперечення «ви просто вибрали надто слабку базову лінію DM» і переносить дискусію до питання, чи поведінка замикання й далі відрізняється за набору придатних до аудиту DM-посилень.

P1A не призначений для вичерпання всіх можливих способів моделювання гало в LambdaCDM і не перетворює сторону DM на високовимірний, непридатний до аудиту припасовувач. Він обирає низьковимірні, відтворювані посилення з чітким реєстром параметрів: розкид концентрації, адіабатичне стискання, ядро зворотного зв’язку, ієрархічний пріор розкиду c–M, однопараметричний проксі ядра, nuisance-член калібрування зсуву слабкого лінзування і комбіновану базову лінію DM_STD.

Основне читання P1A

Серед трьох legacy-гілок лише feedback/core дає невелике чисте зростання сили замикання; SCAT і AC не дають чистого приросту замикання.

DM_HIER_CMSCAT, DM_RAZOR_M і DM_CORE1P мають дуже малий вплив на силу замикання або не демонструють значного чистого поліпшення.

DM_STD може істотно поліпшити спільний logL, але його сила замикання зменшується, що вказує: він переважно поліпшує гнучкість спільного припасування, а не силу перенесеного прогнозу RC→GGL.

EFT_BIN усе ще зберігає вищу силу замикання і перевагу спільного припасування в таблиці B1 P1A; тому основне твердження P1 не слід зводити до «вона перемогла лише мінімальний DM_RAZOR».

Рисунок B1 | Табло P1A: замикання і спільне ΔlogL відносно базової лінії (більше — краще).

Як читати цей рисунок

Цей рисунок показує продуктивність кількох гілок DM-посилення відносно базової лінії.

Його сенс не в тому, що «усю DM виключено», а ось у чому: в межах низьковимірних, придатних до аудиту DM-посилень, обраних P1A, посилення DM не усуває перевагу замикання EFT_BIN.

10 | Чому експеримент P1 важливий

10.1 Методологічне значення: поставити «замикання між зондами» вище за «припасування одного зонда»

Теорія галактичного масштабу легко може застрягти на питанні, чи здатна модель припасувати певний набір кривих обертання. P1 піднімає питання на один рівень вище: чи можуть параметри, вивчені з RC, прогнозувати слабке лінзування без переналаштування на GGL? Це перетворює P1 із «змагання припасувань» на «тест перенесеного прогнозу».

10.2 Значення прозорості: трактувати ланцюг відтворюваності як частину результату

Важливий внесок P1 у тому, що він разом публікує дані, таблиці й рисунки, мітки запусків, негативні контролі, пакет відтворення й аудиторський ланцюг. Це важливо і для прихильників, і для критиків: дискусія може повертатися до тих самих відкритих даних, того самого відображення, тих самих скриптів і тих самих метрик, а не порівнювати гасла.

10.3 Фізичне значення: сильний стрес-тест для напрямів «гравітації без темної матерії»

У напрямах гравітації без темної матерії багато моделей можуть пояснити частину кривих обертання або RAR. Складніше завдання — також пройти зчитування слабкого лінзування і показати за негативних контролів, що сигнал залежить від правильного відображення. P1 важливий тим, що поміщає середня гравітаційна відповідь EFT у протокол, схожий на зовнішній іспит: RC — навчальний майданчик, GGL — поле перенесення, а shuffle — поле проти шахрайства.

10.4 Чи є це важливим експериментом для поля «гравітації без темної матерії»?

Обережно сформульовано: якщо обробка даних P1, пакет відтворення і протокол замикання витримають зовнішню перевірку, тоді це можна вважати експериментом замикання RC+GGL, який варто серйозно сприймати в напрямах гравітації без темної матерії / модифікованої гравітації. Його важливість не в гаслі «темну матерію спростовано», а в тому, що він дає критерій міжзондової перевірки, який можна відтворювати, оскаржувати й розширювати.

Чи вже існують каркаси прогнозного замикання RC+GGL на тому самому рівні?

Існують релевантні каркаси й спостережні традиції: MOND/RAR добре організує багато явищ кривих обертання; робота KiDS-1000 зі слабколінзувальним RAR також порівнювала MOND, emergent gravity Verlinde і моделі LambdaCDM; LambdaCDM теж може пояснювати деякі слабколінзувальні/динамічні явища через зв’язки галактика–гало, газові гало та моделювання зворотного зв’язку.

Але точне твердження P1 не в тому, що «жоден інший каркас у світі не може пояснити RC+GGL». Натомість за власним відкритим протоколом P1 — фіксоване відображення, замикання RC-only→GGL, негативні контролі з перемішуванням, реєстр параметрів і багатомодельні DM-стрес-тести P1A — EFT повідомляє про сильнішу продуктивність замикання.

Інакше кажучи, частина P1, яка найбільше варта зовнішньої перевірки, — це його конкретний, відтворюваний протокол порівняння. Дуже корисним наступним кроком було б побачити, чи можуть MOND/RAR, LambdaCDM/HOD, гідродинамічні симуляції або інші каркаси модифікованої гравітації досягти таких самих або вищих оцінок замикання за тим самим протоколом.

11 | Що P1 може виснувати, а чого не може?

Таблиця 3 | Межі висновків P1

Можна виснувати	За даними RC+GGL, фіксованим відображенням і основним протоколом порівняння P1 сімейство EFT має вищі оцінки спільного припасування і силу замикання, ніж мінімальний DM_RAZOR.
Можна виснувати	У низьковимірному, придатному до аудиту діапазоні DM-посилень P1A кілька DM-посилень не усувають перевагу замикання EFT_BIN.
Можна виснувати	Негативний контроль із перемішуванням показує, що сигнал замикання залежить від правильного міжданого відображення і не може бути отриманий за довільних відображень.
Не можна виснувати	Не можна казати, що P1 спростував усі моделі темної матерії. P1A усе ще не вичерпує несферичність, залежність від середовища, складні зв’язки галактика–гало, високовимірний зворотний зв’язок або повні космологічні симуляції.
Не можна виснувати	Не можна казати, що повний каркас EFT доведено з перших принципів. P1 тестує лише феноменологічний шар середньої гравітаційної відповіді.
Не можна виснувати	Не можна казати, що всі систематики виключено. P1 дає докази робастності лише в межах перелічених стрес-тестів і сфери аудиту.

12 | Поширені запитання від загальних читачів

Q1: Чи означає це, що «темної матерії не існує»?

Ні. Висновки P1 мають бути обмежені даними, протоколом і порівнюваними моделями, використаними тут. P1A виходить за межі мінімального DM_RAZOR, але все одно не представляє всі можливі моделі темної матерії.

Q2: Чи означає це, що «EFT доведено»?

Також ні. P1 тестує EFT як параметризацію середньої гравітаційної відповіді й показує сильнішу продуктивність у замиканні RC→GGL; мікроскопічний механізм і повна теорія не є висновком P1.

Q3: Чому не повідомити значущість безпосередньо в σ?

P1 використовує уніфіковані оцінки правдоподібності, інформаційні критерії та різниці замикання. ΔlogL — це відносна перевага за тим самим правилом оцінювання; вона не еквівалентна одному значенню σ.

Q4: Навіщо перемішувати RC-bin→GGL-bin?

Це негативний контроль. Реальний сигнал між зондами має залежати від правильного відображення; якщо він залишався б таким само сильним після перемішування, це радше вказувало б на можливе зміщення реалізації або статистичний хибний сигнал.

Q5: Що P1 має робити далі?

Розширити той самий протокол на більше даних, більше DM-порівнянь, складніші систематики й більше каркасів модифікованої гравітації — особливо так, щоб зовнішні команди могли повторно тестувати його за тією самою метрикою замикання.

13 | Міні-словник

Таблиця 4 | Міні-словник

Термін	Пояснення одним реченням
Крива обертання (RC)	Співвідношення радіус–швидкість обертання в галактичному диску, яке використовується для виведення ефективної гравітації всередині диска.
Слабке лінзування (GGL)	Міра середнього гравітаційного/масового розподілу навколо передніх галактик через статистичне викривлення форм фонових галактик.
Тест замикання	Використовує апостеріор RC для прогнозування GGL, а потім порівнює його з негативним контролем, створеним перемішаним відображенням.
Негативний контроль	Навмисно ламає ключову структуру, щоб побачити, чи зникає сигнал; використовується для виключення хибних сигналів.
NFW-гало	Профіль густини гало темної матерії, який широко використовується в моделях холодної темної матерії.
Співвідношення c–M	Співвідношення між концентрацією c гало темної матерії та масою M; те, чи дозволено розкид, впливає на гнучкість моделі.
DM_STD	Стандартизована гілка DM-стрес-тесту в P1A, яка поєднує кілька низьковимірних DM-посилень і nuisance-член лінзування.
ΔlogL	Різниця лог-правдоподібності між двома моделями за тим самим правилом оцінювання; додатне значення означає, що перша краща.
Коваріація	Матричний опис кореляцій між точками даних; дані слабкого лінзування зазвичай потребують повної коваріації.

14 | Рекомендований шлях читання і точки входу для цитування

1. Спершу прочитайте розділи 0–2 цього посібника, щоб встановити питання P1 і навмисно стриману роль EFT у P1.

2. Потім прочитайте рисунок S3, рисунок S4 і таблиці S1a/S1b, щоб зрозуміти силу замикання, спільне припасування й негативні контролі.

3. Якщо вас непокоїть, що «базова лінія DM надто слабка», переходьте прямо до розділу 9 і таблиці B1 / рисунка B1.

4. Для технічної перевірки поверніться до технічного звіту P1 v1.1, додатка Tables & Figures Supplement і пакета full_fit_runpack.

Головні архівні точки входу

Технічний звіт P1 (рівень релізу, Concept DOI): 10.5281/zenodo.18526334

Повний пакет відтворення P1 (Concept DOI): 10.5281/zenodo.18526286

Структурована база знань EFT (необов’язково, Concept DOI): 10.5281/zenodo.18853200

Примітка про ліцензію: технічний звіт використовує CC BY-NC-ND 4.0; повний пакет відтворення використовує CC BY 4.0 (авторитетними джерелами вважайте технічний звіт і архіви Zenodo).

15 | Посилання і зовнішній контекст

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.