Публічне пояснення на основі P1_RC_GGL: строгого тесту замикання галактичної динаміки та слабкого лінзування (v1.1)
Примітки до читання |
Це пояснювальний текст, а не ще один академічний звіт. Він спирається на оригінальний звіт P1, зберігає ключові таблиці та рисунки й у кожному важливому місці додає публічне пояснення «що це означає». |
Цей текст пояснює лише ті висновки, яких P1 досягає в межах заданих наборів даних, реєстру параметрів і статистичного протоколу: у спільному тесті кривих обертання галактик (RC) і слабкого лінзування галактика—галактика (GGL) модель середнього гравітаційного відгуку EFT явно випереджає мінімальний базис DM_RAZOR, протестований тут. |
Цей текст не читає P1 як висновок про «повалення темної матерії». P1 — лише перший крок експериментів серії P: він тестує один спостережуваний рівень EFT, «середню гравітаційну основу», а не весь зміст теорії EFT. |
I. Зрозуміти P1 за п’ять хвилин: що саме перевіряє це дослідження?
P1 можна розглядати як експеримент взаємної перевірки між різними спостережними зондами. Він не просто питає, чи здатна модель підігнати один набір даних; він ставить на той самий аудиторський стіл два зовсім різні гравітаційні зчитування: криві обертання (RC) зчитують динаміку всередині галактичного диска, а слабке лінзування галактика—галактика (GGL) зчитує проєктований гравітаційний відгук на більших масштабах.
- RC працює як «спідометр»: воно показує, з якою швидкістю газ і зорі обертаються на різних радіусах у диску галактики.
- GGL працює як «ваги»: за тим, наскільки галактики переднього плану ледь викривляють світло фонових галактик, воно відновлює середній розподіл гравітації/маси навколо галактик на більших масштабах.
- Ключове питання P1 таке: чи може та сама модель спершу навчитися закономірності з RC, а потім зберегти сенс, коли цю закономірність перенесено на GGL?
Найкоротше ядро P1 |
P1 піднімає планку порівняння з питання «чи добре це підганяється окремо?» до питання «чи може це замкнутися між зондами?». Якщо модель добре працює за правильного відображення, а після перемішування сигнал колапсує, тоді ймовірніше, що вона схопила спільну для RC і GGL гравітаційну структуру. |
Таблиця 0 | Ключові числа P1 і спосіб їх читання для широкого читача
Метрика | Як це читається в P1 / P1A | Як це зрозуміти широкому читачеві |
Спільна підгонка ΔlogL_total | У головному порівнянні основного тексту EFT відносно DM_RAZOR: 1155–1337 | Різниця сумарних балів для двох наборів даних разом; більше означає кращу загальну пояснювальну силу. |
Сила замикання ΔlogL_closure | У головному порівнянні основного тексту EFT: 172–281; DM_RAZOR: 127 | Здатність прогнозувати GGL після висновку лише з RC; більше означає сильнішу «міжзондову самоузгодженість». |
Негативний контроль shuffle | Після перемішування RC-bin→GGL-bin сигнал замикання EFT падає до 6–23 | Якщо правильну відповідність зруйновано, перевага має зникнути; що виразніше зникнення, то краще відсіюється псевдосигнал. |
Багатомодельний DM-стрес-тест P1A | DM 7+1 + DM_STD із збереженням EFT_BIN як контролю | P1A дивиться не лише на мінімальний DM_RAZOR, а поміщає кілька низьковимірних аудитовних DM-посилених гілок у той самий протокол замикання. |
II. Навіщо потрібен P1: де застрягає космологія галактичного масштабу?
Проблема галактичного масштабу лишається складною тому, що потреба в «додатковій гравітації/масі» не є лише явищем кривих обертання. Багато спостережень показують тісний зв’язок між видимою баріонною речовиною в галактиках і фактичними динамічними та лінзувальними зчитуваннями. Для маршруту темної матерії це означає, що темні гало, баріонний зворотний зв’язок, історія формування галактик і систематичні похибки спостережень мають бути узгоджені дуже тонко. Для маршрутів без темної матерії це означає, що модель не може добре виглядати лише на RC: вона має витримати слабке лінзування, популяційні масштабні закони й негативні контролі.
Саме це мотивує P1. Він не виходить із тези «темна матерія помилкова» чи «EFT обов’язково правильна». Він виносить на перевірку одне тестоване твердження: чи може середній гравітаційний відгук EFT залишити відтворюваний і переносний сигнал у міжзондовому замиканні RC→GGL?
Зовнішній літературний контекст: чому вікно RC+GGL важливе? |
Запропоноване McGaugh, Lelli та Schombert у 2016 році радіальне прискорювальне співвідношення (RAR) показало тісний зв’язок із малою дисперсією між спостережуваним прискоренням, яке відстежують криві обертання, і прискоренням, передбаченим баріонною речовиною. Саме тому «зв’язок баріонів із гравітаційним відгуком» став питанням, яке теорії галактичного масштабу не можуть обійти. |
Brouwer та ін. у 2021 році використали слабке лінзування KiDS-1000, щоб поширити RAR на нижчі прискорення й більші радіуси, порівнявши MOND, emergent gravity Верлінде та моделі LambdaCDM. Вони також вказали, що відмінності ранніх і пізніх типів галактик, газові гало та зв’язок галактика—гало залишаються ключовими пояснювальними питаннями. |
Mistele та ін. у 2024 році додатково використали слабке лінзування для виведення кругових швидкісних кривих ізольованих галактик і повідомили, що вони не мають явного спадання на масштабах у сотні kpc і навіть близько 1 Mpc, узгоджуючись із BTFR. Це показує, що слабке лінзування стає важливим зовнішнім зчитуванням для перевірки гравітаційного відгуку галактичного масштабу. |
Тому цінність P1 не в тому, що він нібито першим обговорює RC і GGL разом. Його цінність у тому, що він поміщає їх в аудитовний протокол: фіксоване відображення, реєстр параметрів, замикання RC-only→GGL, негативний контроль shuffle і багатомодельний DM-стрес-тест P1A.
III. Що означає EFT у P1? Це не ефективна теорія поля
Тут EFT означає Теорію Нитки Енергії, а не звичну для фізики ефективну теорію поля (Effective Field Theory). У технічному звіті P1 EFT використано дуже стримано: вона не бере участі як завершена «остаточна теорія», а спочатку стискається до спостережуваної, підгінної й потенційно спростовної параметризації «середнього гравітаційного відгуку».
Простіше кажучи, P1 поки не обговорює всі мікроскопічні джерела додаткової гравітації й не намагається одним кроком довести весь каркас EFT. Він ставить вужче й жорсткіше питання: якщо на масштабі галактик існує певний середній додатковий гравітаційний відгук, чи здатен він спершу пояснити RC, а потім переносно передбачити GGL?
Яку частину EFT тестує P1? |
P1 тестує «середню гравітаційну основу» (mean gravity floor): статистично стабільний середній внесок, який може переноситися між вибірками. |
P1 поки не опрацьовує «шумову основу» (stochastic / noise floor): випадкові члени, індивідуальні відмінності або додаткову дисперсію, які могли б походити від мікроскопічніших флуктуаційних процесів. |
P1 також не обговорює повний мікромеханізм, поширеність, часи життя чи глобальні космологічні обмеження. Це перший крок експериментів серії P, а не остаточний вирок. |
IV. План серії P1: чому перший крок починається із «середньої основи»?
Серію P можна розуміти як спостережну програму пошуку для EFT. Вона не розкладає всі твердження одразу, а спершу виносить окремо той шар, який найпростіше перевірити на відкритих даних. Стратегія P1 — спочатку тестувати середній член: якщо середній гравітаційний відгук не може замкнутися навіть у переході RC→GGL, тоді розмова про складніші шумові члени чи мікромеханізми не має надійного входу.
Таблиця 1 | Пошарове позиціювання серії P
Рівень | Питання | Місце в P1 |
P1 | Чи може середній гравітаційний відгук замкнутися в RC→GGL? | Головне питання поточного звіту |
P1A | Якщо посилити бік DM, чи лишаються висновки стійкими? | Додаток B: стрес-тест DM 7+1 + DM_STD |
Подальша серія P | Чи можна розширити протокол на більше даних, більше зондів і складніші систематичні похибки? | Напрям подальшої роботи |
Глибше питання | Як середній член, шумовий член і мікромеханізм пов’язані між собою? | Поза межами висновків P1 |
V. Які тут дані? Що окремо повідомляють RC і GGL?
V.I. Криві обертання RC: «лінійка швидкості» в диску галактики
Криві обертання фіксують, як швидко газ і зорі обертаються навколо центра на різних відстанях від нього. Що вища швидкість, то сильніша доцентрова сила потрібна на цьому радіусі — тобто тим сильніша ефективна гравітація. P1 використовує базу SPARC: після попередньої обробки до аналізу внесено 104 галактики, 2295 точок швидкості й поділено їх на 20 RC-bin.
V.II. Слабке лінзування GGL: «гравітаційні ваги» на більших масштабах
Слабке лінзування галактика—галактика вимірює, як галактики переднього плану ледь викривляють світло фонових галактик. Воно відповідає проєктованому гравітаційному відгуку на більших, гало-масштабах і не залежить від деталей газової динаміки в диску. P1 використовує відкриті GGL-дані KiDS-1000 / Brouwer та ін. 2021: 4 біні зоряної маси, по 15 радіальних точок у кожному, разом 60 точок даних, із повною коваріацією.
V.III. Фіксоване відображення: чому 20 RC-bin → 4 GGL-bin є критично важливим?
P1 з’єднує 20 RC-bin із 4 GGL-bin за фіксованим правилом: кожен GGL-bin відповідає 5 RC-bin, а середнє береться з вагами за кількістю галактик. Це відображення однакове для всіх моделей і є жорстким обмеженням для тесту замикання та справедливого порівняння.
Чому не можна налаштовувати відображення заднім числом? |
Якщо дозволити після факту обирати, «які RC-bin відповідають яким GGL-bin», модель могла б створити замикання просто добором відповідностей. P1 заздалегідь фіксує відображення 20→4 і навмисно руйнує його негативним контролем shuffle саме для того, щоб перевірити, чи справді сигнал замикання залежить від фізично обґрунтованої відповідності. |
VI. Моделі та метод: що саме порівнює P1?
VI.I. Бік EFT: низьковимірний середній гравітаційний відгук
На боці EFT середній гравітаційний відгук описується низьковимірним додатковим швидкісним членом. Форму цього додаткового члена задає безрозмірна ядерна функція f(r/ℓ), де ℓ — глобальний масштаб, а амплітуда задається за RC-bin. Різні ядерні функції представляють різні початкові нахили, швидкості переходу й далекодійні хвости; вони потрібні для стрес-тестів робастності.
VI.II. Бік DM: головне порівняння в тексті й додаток P1A треба читати окремо
У головному порівнянні основного тексту DM_RAZOR — це мінімалізована й аудитовна базова NFW-лінія: фіксоване співвідношення c–M, без halo-to-halo scatter, адіабатичного стискання, feedback core, несферичності чи середовищних членів. Перевага такого дизайну — контрольована кількість ступенів свободи й легка відтворюваність; недолік — він не репрезентує всі LambdaCDM-моделі чи всі моделі гало темної матерії.
Тому в додатку B (P1A) бік DM перетворено на набір «стандартизованих стрес-тестів»: не змінюючи спільного відображення й протоколу замикання, поступово додають низьковимірні посилені гілки SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m і комбіновану базу DM_STD, залишаючи EFT_BIN як контроль. P1A варто читати так: порівняння не зводиться до одного мінімального DM-базису; групу поширених і аудитовних DM-механізмів вимірюють тією самою «лінійкою замикання».
Точне формулювання висновку в цьому тексті |
Основний текст: серія EFT у головному порівнянні явно перевершує мінімальний DM_RAZOR. |
Додаток B / P1A: під кількома низьковимірними аудитовними DM-посиленими гілками та стрес-тестом DM_STD частина спільної підгонки DM може покращуватися, але сила замикання не усуває переваги EFT_BIN. |
Тому найобережніше формулювання таке: у межах даних, відображення, реєстру параметрів і протоколу замикання P1/P1A середній гравітаційний відгук EFT демонструє сильнішу міждану узгодженість; це не означає виключення всіх моделей темної матерії. |
VI.III. Тест замикання: найважливіша експериментальна логіка P1
1. Виконати підгонку лише на RC й отримати набір апостеріорних зразків RC-only.
2. Не дозволяти повторного налаштування на GGL; безпосередньо використати апостеріор RC для прогнозу GGL.
3. За повною коваріацією обчислити GGL-оцінку прогнозу logL_true для правильного відображення.
4. Випадково переставити відповідність RC-bin→GGL-bin і обчислити негативний контроль logL_perm.
5. Відняти одне від одного й отримати силу замикання: ΔlogL_closure = <logL_true> − <logL_perm>.
Популярна аналогія |
Тест замикання схожий на повторний іспит в іншій аудиторії: модель спершу навчається закономірності на іспиті RC, а потім відповідає на іспиті GGL. Якщо вона справді навчилася спільної закономірності, а не локального прийому, то має добре відповідати і після зміни аудиторії; якщо навмисно перемішати відповідність між аудиторіями, перевага має зникнути. |
VI.IV. Перед технічними таблицями: чотири точки входу
Таблиця 5.4 | Маршрут читання наступної групи широких технічних таблиць
Вхід | Що дивитися | Чому це важливо |
Таблиця S1a | Сумарний бал спільної підгонки RC+GGL | Відповідає на питання: «Якщо дивитися на два набори даних разом, чиє загальне пояснення сильніше?» |
Таблиця S1b | Сила замикання, shuffle і сканування робастності | Відповідає на питання: «Чи може те, що вивчено з RC, перенестися на GGL?» |
Таблиця B0 | Визначення кількох DM-посилених гілок у P1A | Не дає звести P1 до «порівняння лише з мінімальним DM_RAZOR». |
Таблиця B1 | Табло замикання та спільної підгонки P1A | Перевіряє, чи зникає перевага замикання після посилення DM. |
Примітка до верстки |
Починаючи з наступної сторінки використано альбомну орієнтацію, щоб повністю зберегти широкі таблиці оригінального звіту, не вирізати стовпці й не стискати їх до нечитабельності. Основний текст уже подав читання для широкого читача; широкі технічні таблиці призначені для тих, кому потрібно звірити числа та модельні гілки. |
Рисунок 0.1 | Процес тесту замикання P1 в одній схемі

Пояснення: верхній ланцюг — це «тест замикання» (підгонка лише на RC → прогноз GGL за апостеріором RC); нижній ланцюг — «спільна підгонка» (RC+GGL оцінюються разом). Праворуч справжнє відображення порівнюється з перемішаним, і з цього отримують силу замикання ΔlogL.
VII. Ключові технічні таблиці: головні таблиці оригінального звіту й таблиці P1A
Таблиця S1a | Основні метрики спільної підгонки (RC+GGL, Strict; збережено з оригінального звіту)
Модель (workspace) | W-ядро | k | Спільний logL_total (best) | ΔlogL_total vs DM | AICc | BIC |
DM_RAZOR | немає | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | немає | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
Таблиця S1b | Метрики замикання й робастності (Strict; збережено з оригінального звіту)
Модель (workspace) | Замикання ΔlogL (true-perm) | ΔlogL після shuffle-негативного контролю | Діапазон ΔlogL у скануванні σ_int | Діапазон ΔlogL у скануванні R_min | Діапазон ΔlogL у скануванні cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
Таблиця B0 | Визначення посилених DM-гілок у P1A (збережено з додатка B оригінального звіту)
Workspace | dm_model | Нові параметри (≤1) | Фізична мотивація (ядро) | Принцип реалізації (дружній до аудиту) |
DM_RAZOR | NFW (фіксоване c–M, без scatter) | — | Мінімізована, аудитовна базова лінія гало LambdaCDM; використовується як строгий контроль для EFT | Спільне відображення фіксоване; реєстр параметрів строгий; baseline використовується лише для відносного порівняння |
DM_RAZOR_SCAT | NFW + c–M scatter (legacy) | σ_logc | Співвідношення c–M має розсіяння; воно апроксимується однопараметричним log-normal scatter | ≤1 новий параметр; спільне відображення зберігається; приріст замикання — критерій прийняття |
DM_RAZOR_AC | NFW + Adiabatic Contraction (legacy) | α_AC | Падіння баріонів може спричиняти адіабатичне стискання гало; використано однопараметричну апроксимацію інтенсивності | ≤1 новий параметр; відображення не змінюється; звітуються зміни AICc/BIC і приріст замикання |
DM_RAZOR_FB | NFW + feedback core (legacy) | log r_core | Зворотний зв’язок може формувати core у внутрішній зоні; використано однопараметричну апроксимацію масштабу core | ≤1 новий параметр; замикання й негативний контроль у тому самому форматі; поліпшення RC-only не є єдиною метою |
DM_HIER_CMSCAT | Ієрархічний c–M scatter + prior | σ_logc(hier) | Стандартніша ієрархічна форма c_i∼logN(c(M_i),σ_logc); водночас впливає на спільний апостеріор RC і GGL | Явний prior; латентні c_i маргіналізуються; модель лишається низьковимірною й аудитовною |
DM_CORE1P | 1‑параметричний core proxy (натхнено coreNFW/DC14) | log r_core | Однопараметричний core-проксі замінює головний ефект baryonic feedback, уникаючи високовимірних деталей зоретворення | Спирається на стандартну літературу; ≤1 новий параметр; пов’язано з тестом замикання |
DM_RAZOR_M | NFW + nuisance для калібрування shear у лінзуванні | m_shear(GGL) | Ключову систематику на боці слабкого лінзування поглинає ефективний параметр, зменшуючи ризик «прийняти систематичну похибку за фізику» | nuisance явно обліковується; зворотний вплив на RC не дозволяється; результат оцінюється передусім за робастністю замикання |
DM_STD | Стандартизований DM-baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | Три найпоширеніші закиди включено в один усе ще низьковимірний стандартизований baseline | Реєстр параметрів та інформаційні критерії звітуються разом; замикання — головна метрика; використовується як найсильніший оборонний DM-контроль |
Таблиця B1 | Табло P1A (більше — краще; збережено з додатка B оригінального звіту)
Модельна гілка (workspace) | Δk | RC-only best logL_RC (Δ) | Сила замикання ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
Як читати таблицю B1 (табло P1A) |
• Δk: додані ступені свободи (що більше, то складніша модель; складніше не означає краще). • Головні дві колонки: сила замикання ΔlogL_closure(Δ) (що більше, то сильніша переносна самоузгодженість) і Joint best logL_total(Δ) (сумарний бал спільної підгонки). • (Δ) у дужках означає різницю відносно DM_RAZOR, щоб порівняння було прямим. |
• Головне питання цієї таблиці: чи зникає перевага замикання після «розумного посилення» DM-базису? • Підказка для читання: спільний бал DM_STD помітно зростає, але сила замикання, навпаки, падає; EFT_BIN усе ще має вищу силу замикання. |
Підсумок в одному реченні: у цьому наборі низьковимірних аудитовних DM-посилень краща спільна підгонка не автоматично дає сильніше замикання; замикання, тобто переносність, лишається ключовим критерієм. |
VIII. Як читати головні результати?
VIII.I. Спільна підгонка: якщо дивитися на два набори даних разом, головне порівняння EFT має вищий бал
Таблиця S1a і рисунок S4 показують: за тих самих даних, того самого спільного відображення й приблизно того самого масштабу параметрів спільне ΔlogL_total серії EFT відносно DM_RAZOR становить 1155–1337. Для широкого читача це означає: за одним правилом оцінювання, коли RC і GGL беруться разом, головні моделі EFT набирають вищий сумарний бал.
VIII.II. Тест замикання: головний акцент P1 — переносність
Висока сила замикання означає, що модель, використовуючи лише параметри, виведені з RC, і не дивлячись знову на GGL, усе одно краще прогнозує GGL. У звіті P1 для EFT ΔlogL_closure дорівнює 172–281, а для DM_RAZOR — 127. Цей результат важливіший за фразу «кожна модель добре підганяється сама по собі», бо він обмежує свободу моделі на другому наборі даних.
VIII.III. Негативний контроль: чому «колапс сигналу» — це добра ознака?
Коли P1 випадково перемішує групову відповідність RC-bin→GGL-bin, сигнал замикання EFT падає до рівня 6–23. Для широкого читача цей крок є своєрідним «античітом»: якби перевага замикання виникала лише через код, одиниці, коваріацію чи випадковість підгонки, вона могла б зберігатися і після перемішування. Натомість перевага колапсує, отже вона залежить від правильного відображення.

Рисунок S3 | Сила замикання (більше — краще): середня перевага лог-правдоподібності для прогнозу RC-only → GGL.
Як читати цей рисунок |
Цей рисунок є ядром P1. Що вищий стовпчик, то краще інформація, вивчена моделлю з RC, переноситься на GGL. |
Серія EFT загалом вища за DM_RAZOR; це означає, що в експерименті «спершу вивчити RC, потім передбачити GGL» міжзондове замикання EFT сильніше. |

Рисунок S4 | Перевага спільної підгонки (більше — краще): best logL_total для RC+GGL відносно DM_RAZOR.
Як читати цей рисунок |
Цей рисунок показує сумарний бал після спільного аналізу RC і GGL. |
Уся серія EFT значно вища за 0; це показує, що перевага EFT у головному порівнянні не є локальним ефектом однієї точки, а є загальною поведінкою спільного аналізу. |

Рисунок R1 | Негативний контроль: після shuffle-групування сигнал замикання різко зменшується.
Як читати цей рисунок |
Цей рисунок показує: щойно правильну відповідність RC↔GGL bin перемішано, сигнал замикання різко падає. |
Це робить результат P1 схожим на реальну узгодженість у міжданому відображенні, а не на числовий збіг, який можна отримати за будь-якого відображення. |
IX. Робастність і контролі: як P1 уникає заперечення «це просто гарна підгонка»?
Найлегше технічний звіт поставити під сумнів так: чи не походить перевага від певного налаштування шуму, окремої ділянки центральної зони, конкретної обробки коваріації або від перенавчання? P1 відповідає на це серією стрес-тестів.
Таблиця 2 | Як читати робастність і негативні контролі P1
Тест | Який сумнів він перевіряє | Як читати |
Сканування σ_int | Якщо в RC є додаткова невідома дисперсія, чи лишається висновок стійким? | Після послаблення похибок RC порядок EFT і масштаб переваги лишаються стабільними. |
Сканування R_min | Якщо не повністю довіряти центральним зонам галактик, чи лишається висновок стійким? | Після відсікання центральних зон EFT усе ще зберігає позитивну перевагу. |
Сканування cov-shrink | Якщо оцінка коваріації GGL невизначена, чи лишається висновок стійким? | Коли коваріація стискається до діагональної матриці, перевага майже нечутлива. |
Абляційна драбина | Чи EFT не підганяє дані силою зайвої складності? | Повний EFT_BIN є необхідним за інформаційними критеріями. |
LOO-прогноз із відкладенням | Чи модель пояснює лише вже бачені дані? | Після відкладення GGL-bin модель усе ще показує сильну здатність до узагальнення. |
RC-bin shuffle | Чи походить замикання зі справжнього відображення? | Після перемішування груп замикання падає, підтримуючи залежність від відображення. |

Рисунок R2 | Діапазон ΔlogL_total під час сканування σ_int (більше — краще).
Як читати цей рисунок |
Перевіряє, чи зберігається лідерство EFT після зміни налаштування внутрішньої дисперсії RC. |

Рисунок R3 | Діапазон ΔlogL_total під час сканування R_min (більше — краще).
Як читати цей рисунок |
Перевіряє, чи лишається перевага EFT стабільною після відсікання складних центральних зон. |

Рисунок R4 | Діапазон ΔlogL_total під час сканування cov-shrink (більше — краще).
Як читати цей рисунок |
Перевіряє, чи чутливий порядок моделей до зміни обробки коваріації слабкого лінзування. |

Рисунок R5 | Абляційна драбина EFT_BIN (AICc; менше — краще).
Як читати цей рисунок |
Перевіряє, чи повний EFT_BIN справді потрібен для пояснення даних, а не просто додає параметри. |

Рисунок R6 | LOO: розподіл лог-правдоподібності для відкладених bin.
Як читати цей рисунок |
Перевіряє, чи модель зберігає прогнозну силу на невідомих їй GGL-bin. |

Рисунок R7 | Негативний контроль: shuffle-відображення помітно знижує mean logL_true у замиканні.
Як читати цей рисунок |
Додатково показує з погляду mean logL_true, що замикання залежить від правильного міжданого відображення. |
X. P1A: чому «кілька DM-моделей у додатку» є ключовим уточненням?
Цей розділ відповідає не на питання «чи EFT виграла лише проти мінімального DM_RAZOR?», а на інше: якщо посилити DM-базу в низьковимірному, відтворюваному й прозорому за параметрами діапазоні (P1A), чи зміняться висновки тесту замикання та спільної підгонки? Інакше кажучи, мета P1A — зменшити закид «ви просто обрали надто слабкий DM-базис» і перевести розмову до питання, чи зберігається різниця в замиканні під групою аудитовних DM-посилень.
Дизайн P1A не намагається вичерпати всі можливості моделювання гало в LambdaCDM і не перетворює бік DM на високовимірний, неаудитовний підгінний механізм. Він обирає низьковимірні, відтворювані й чітко обліковані посилення: розсіяння концентрації, адіабатичне стискання, feedback core, ієрархічний prior для c–M scatter, однопараметричний core-проксі, nuisance для shear-calibration у слабкому лінзуванні та комбінований DM_STD.
Головне читання P1A |
Серед трьох legacy-гілок лише feedback/core дає невеликий чистий приріст сили замикання; SCAT і AC не дають чистого приросту замикання. |
DM_HIER_CMSCAT, DM_RAZOR_M і DM_CORE1P мають дуже малий вплив на силу замикання або не показують помітного чистого приросту. |
DM_STD може суттєво покращити joint logL, але сила замикання знижується; це вказує, що він переважно підвищує гнучкість спільної підгонки, а не переносну прогнозну силу RC→GGL. |
EFT_BIN у таблиці B1 P1A і далі зберігає вищу силу замикання та перевагу спільної підгонки. Тому ключове твердження P1 не слід спрощувати до «виграно лише проти мінімального DM_RAZOR». |

Рисунок B1 | Табло P1A: ΔlogL замикання та спільної підгонки відносно baseline (більше — краще).
Як читати цей рисунок |
Цей рисунок показує поведінку кількох DM-посилених гілок відносно базової лінії. |
Його значення не в тому, щоб «виключити весь DM», а в тому, що в межах низьковимірних аудитовних DM-посилень, обраних P1A, посилення DM не усуває переваги замикання EFT_BIN. |
XI. Значення експерименту P1: чому це варто робити?
XI.I. Методологічне значення: поставити «міжзондове замикання» вище за «підгонку одного зонда»
Теорії галактичного масштабу найчастіше застрягають у суперечці про те, чи може певна модель підігнати певний набір кривих обертання. P1 піднімає питання на рівень вище: чи можуть параметри, вивчені з RC, передбачити слабке лінзування без повторного налаштування на GGL? Саме це перетворює P1 із «змагання підгонок» на «тест переносного прогнозування».
XI.II. Значення прозорості: зробити відтворюваний ланцюг частиною результату
Один із важливих внесків P1 полягає в тому, що він публікує дані, таблиці й рисунки, run-теги, негативні контролі, пакет відтворення та аудиторський ланцюг разом. Це важливо і для прихильників, і для критиків: дискусія може повертатися до тих самих відкритих даних, того самого відображення, тих самих скриптів і тих самих метрик, а не зводитися до порівняння гасел.
XI.III. Фізичне значення: сильний стрес-тест для напряму «гравітації без темної матерії»
У напрямі гравітації без темної матерії багато моделей можуть пояснити якусь частину кривих обертання або RAR. Складніше інше: водночас пройти зчитування слабкого лінзування й у негативному контролі показати, що сигнал залежить від правильного відображення. Значення P1 у тому, що він поміщає середній гравітаційний відгук EFT у протокол, схожий на «зовнішній іспит»: RC — тренувальний майданчик, GGL — поле перенесення, а shuffle — античіт.
XI.IV. Чи є це важливим експериментом для напряму гравітації без темної матерії?
Обережне формулювання таке: якщо обробка даних P1, пакет відтворення і протокол замикання витримають зовнішню перевірку, P1 можна вважати RC+GGL-експериментом замикання, який варто серйозно розглядати в напрямах гравітації без темної матерії / модифікованої гравітації. Його важливість не в гаслі «темну матерію спростовано», а в тому, що він пропонує міжзондовий критерій, який можна відтворити, оскаржити й розширити.
Чи вже існують рамки з так само високим прогнозним замиканням RC+GGL? |
Існують споріднені рамки та спостережні традиції: MOND/RAR добре організовує багато явищ кривих обертання; робота зі слабкого лінзування RAR на KiDS-1000 також порівнювала MOND, emergent gravity Верлінде та моделі LambdaCDM. LambdaCDM, своєю чергою, може пояснювати частину слабколінзувальних і динамічних явищ через зв’язок галактика—гало, газові гало та моделювання зворотного зв’язку. |
Точне твердження P1 не полягає в тому, що «у світі немає інших рамок, здатних пояснити RC+GGL». Воно полягає в іншому: за відкрито оприлюдненим самим P1 фіксованим відображенням, замиканням RC-only→GGL, негативним контролем shuffle, реєстром параметрів і багатомодельним DM-стрес-тестом P1A EFT повідомляє про сильнішу поведінку замикання. |
Інакше кажучи, найцінніше місце для зовнішньої перевірки P1 — це запропонований ним конкретний і відтворюваний протокол порівняння. Чи зможуть у майбутньому MOND/RAR, LambdaCDM/HOD, hydrodynamical simulation або інші рамки модифікованої гравітації досягти того самого чи вищого бала замикання за тим самим протоколом — це саме той наступний крок, який варто зробити. |
XII. Що P1 дозволяє висновувати, а чого — ні?
Таблиця 3 | Межі висновків P1
Можна висновувати | У межах RC+GGL-даних P1, фіксованого відображення та головного протоколу порівняння серія EFT має вищу спільну підгонку й силу замикання порівняно з мінімальним DM_RAZOR. |
Можна висновувати | У межах низьковимірних аудитовних DM-посилень P1A кілька DM-посилень не усунули переваги замикання EFT_BIN. |
Можна висновувати | Негативний контроль shuffle показує, що сигнал замикання залежить від правильного міжданого відображення, а не виникає за будь-якого відображення. |
Не можна висновувати | Не можна стверджувати, що P1 уже спростував усі моделі темної матерії. P1A все ще не вичерпує несферичність, залежність від середовища, складний зв’язок галактика—гало, високовимірний зворотний зв’язок або повні космологічні симуляції. |
Не можна висновувати | Не можна стверджувати, що повну теорію EFT вже доведено з перших принципів. P1 перевіряє лише феноменологічний шар середнього гравітаційного відгуку. |
Не можна висновувати | Не можна стверджувати, що всі систематичні похибки виключено. P1 подає докази робастності лише в межах перелічених стрес-тестів і аудиту. |
XIII. Поширені запитання: що найчастіше питає широкий читач
Питання 1: Чи означає це, що «темної матерії не існує»?
Ні. Висновки P1 мають бути обмежені даними, протоколом і контрольними моделями цього тексту. P1A вже йде далі за мінімальний DM_RAZOR, але все ще не репрезентує всі можливі моделі темної матерії.
Питання 2: Чи означає це, що «EFT уже доведено»?
Також ні. P1 перевіряє EFT як параметризацію середнього гравітаційного відгуку й показує сильнішу поведінку в замиканні RC→GGL. Мікроскопічний механізм і повна теорія не є висновком P1.
Питання 3: Чому не подати значущість одразу як σ-значення?
P1 використовує єдину оцінку правдоподібності, інформаційні критерії та різницю замикання. ΔlogL — це відносна перевага за тим самим правилом оцінювання; вона не тотожна одному σ-значенню.
Питання 4: Навіщо перемішувати RC-bin→GGL-bin?
Це негативний контроль. Справжній міжзондовий сигнал має залежати від правильного відображення; якби після перемішування він лишався таким самим сильним, це радше вказувало б на можливе зміщення реалізації або статистичний псевдосигнал.
Питання 5: Що P1 має зробити далі?
Поширити той самий протокол на більше даних, більше DM-контролів, складніші систематичні похибки й більше рамок модифікованої гравітації; особливо важливо, щоб зовнішні групи могли повторно перевірити результат за тією самою метрикою замикання.
XIV. Мінісловник термінів
Таблиця 4 | Мінісловник термінів
Термін | Пояснення в одному реченні |
Крива обертання (RC) | Зв’язок радіус—швидкість у диску галактики; використовується для зворотного виведення ефективної гравітації в площині диска. |
Слабке лінзування (GGL) | Вимірює середній розподіл гравітації/маси навколо галактик переднього плану через статистичне викривлення форм фонових галактик. |
Тест замикання | Прогнозує GGL за апостеріором RC і порівнює з негативним контролем, де відображення перемішано. |
Негативний контроль | Навмисно руйнує ключову структуру, щоб перевірити, чи зникає сигнал; використовується для відсіювання псевдосигналів. |
Гало NFW | Профіль густини гало темної матерії, часто використовуваний у моделях холодної темної матерії. |
Співвідношення c–M | Зв’язок між концентрацією c і масою M гало темної матерії; дозвіл на розсіяння впливає на гнучкість моделі. |
DM_STD | Стандартизована DM-гілка стрес-тесту в P1A, що поєднує кілька низьковимірних DM-посилень і лінзувальний nuisance. |
ΔlogL | Різниця лог-правдоподібності двох моделей за тим самим правилом оцінювання; додатне значення означає перевагу першої. |
Коваріація | Матричний опис кореляцій між точками даних; для даних слабкого лінзування зазвичай потрібно використовувати повну коваріацію. |
XV. Рекомендований маршрут читання та входи для цитування
1. Спочатку прочитайте розділи I–III цього тексту, щоб зрозуміти проблематику P1 і стримане позиціювання EFT у P1.
2. Далі перегляньте рисунки S3, S4 і таблиці S1a/S1b, щоб зрозуміти силу замикання, спільну підгонку та негативний контроль.
3. Якщо вас цікавить, чи «DM-базис не був надто слабким», переходьте прямо до розділу X і таблиці B1 / рисунка B1.
4. Для технічної перевірки зверніться до технічного звіту P1 v1.1, Tables & Figures Supplement і full_fit_runpack.
Основні архівні входи |
Технічний звіт P1 (публікаційний рівень, Concept DOI): 10.5281/zenodo.18526334 |
Повний пакет відтворення P1 (Concept DOI): 10.5281/zenodo.18526286 |
Структурована база знань EFT (необов’язково, Concept DOI): 10.5281/zenodo.18853200 |
Примітка щодо ліцензії: технічний звіт використовує CC BY-NC-ND 4.0; повний пакет відтворення — CC BY 4.0 (орієнтуйтеся на технічний звіт і архів Zenodo). |
XVI. Література та зовнішній контекст
McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.
Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.
Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.
Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.
Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.
Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.