← Експеримент

Публічне пояснення на основі P1_RC_GGL: строгого тесту замикання галактичної динаміки та слабкого лінзування (v1.1)

Оригінальний звіт: Guanglin Tu | Версійна основа: P1 v1.1 | Статус тексту: публічне пояснення / не рецензована стаття
Пов’язані архіви: DOI звіту 10.5281/zenodo.18526334 | DOI пакета відтворення 10.5281/zenodo.18526286

Примітки до читання

Це пояснювальний текст, а не ще один академічний звіт. Він спирається на оригінальний звіт P1, зберігає ключові таблиці та рисунки й у кожному важливому місці додає публічне пояснення «що це означає».

Цей текст пояснює лише ті висновки, яких P1 досягає в межах заданих наборів даних, реєстру параметрів і статистичного протоколу: у спільному тесті кривих обертання галактик (RC) і слабкого лінзування галактика—галактика (GGL) модель середнього гравітаційного відгуку EFT явно випереджає мінімальний базис DM_RAZOR, протестований тут.

Цей текст не читає P1 як висновок про «повалення темної матерії». P1 — лише перший крок експериментів серії P: він тестує один спостережуваний рівень EFT, «середню гравітаційну основу», а не весь зміст теорії EFT.

I. Зрозуміти P1 за п’ять хвилин: що саме перевіряє це дослідження?


P1 можна розглядати як експеримент взаємної перевірки між різними спостережними зондами. Він не просто питає, чи здатна модель підігнати один набір даних; він ставить на той самий аудиторський стіл два зовсім різні гравітаційні зчитування: криві обертання (RC) зчитують динаміку всередині галактичного диска, а слабке лінзування галактика—галактика (GGL) зчитує проєктований гравітаційний відгук на більших масштабах.

Найкоротше ядро P1

P1 піднімає планку порівняння з питання «чи добре це підганяється окремо?» до питання «чи може це замкнутися між зондами?». Якщо модель добре працює за правильного відображення, а після перемішування сигнал колапсує, тоді ймовірніше, що вона схопила спільну для RC і GGL гравітаційну структуру.

Таблиця 0 | Ключові числа P1 і спосіб їх читання для широкого читача

Метрика

Як це читається в P1 / P1A

Як це зрозуміти широкому читачеві

Спільна підгонка ΔlogL_total

У головному порівнянні основного тексту EFT відносно DM_RAZOR: 1155–1337

Різниця сумарних балів для двох наборів даних разом; більше означає кращу загальну пояснювальну силу.

Сила замикання ΔlogL_closure

У головному порівнянні основного тексту EFT: 172–281; DM_RAZOR: 127

Здатність прогнозувати GGL після висновку лише з RC; більше означає сильнішу «міжзондову самоузгодженість».

Негативний контроль shuffle

Після перемішування RC-bin→GGL-bin сигнал замикання EFT падає до 6–23

Якщо правильну відповідність зруйновано, перевага має зникнути; що виразніше зникнення, то краще відсіюється псевдосигнал.

Багатомодельний DM-стрес-тест P1A

DM 7+1 + DM_STD із збереженням EFT_BIN як контролю

P1A дивиться не лише на мінімальний DM_RAZOR, а поміщає кілька низьковимірних аудитовних DM-посилених гілок у той самий протокол замикання.

II. Навіщо потрібен P1: де застрягає космологія галактичного масштабу?


Проблема галактичного масштабу лишається складною тому, що потреба в «додатковій гравітації/масі» не є лише явищем кривих обертання. Багато спостережень показують тісний зв’язок між видимою баріонною речовиною в галактиках і фактичними динамічними та лінзувальними зчитуваннями. Для маршруту темної матерії це означає, що темні гало, баріонний зворотний зв’язок, історія формування галактик і систематичні похибки спостережень мають бути узгоджені дуже тонко. Для маршрутів без темної матерії це означає, що модель не може добре виглядати лише на RC: вона має витримати слабке лінзування, популяційні масштабні закони й негативні контролі.

Саме це мотивує P1. Він не виходить із тези «темна матерія помилкова» чи «EFT обов’язково правильна». Він виносить на перевірку одне тестоване твердження: чи може середній гравітаційний відгук EFT залишити відтворюваний і переносний сигнал у міжзондовому замиканні RC→GGL?

Зовнішній літературний контекст: чому вікно RC+GGL важливе?

Запропоноване McGaugh, Lelli та Schombert у 2016 році радіальне прискорювальне співвідношення (RAR) показало тісний зв’язок із малою дисперсією між спостережуваним прискоренням, яке відстежують криві обертання, і прискоренням, передбаченим баріонною речовиною. Саме тому «зв’язок баріонів із гравітаційним відгуком» став питанням, яке теорії галактичного масштабу не можуть обійти.

Brouwer та ін. у 2021 році використали слабке лінзування KiDS-1000, щоб поширити RAR на нижчі прискорення й більші радіуси, порівнявши MOND, emergent gravity Верлінде та моделі LambdaCDM. Вони також вказали, що відмінності ранніх і пізніх типів галактик, газові гало та зв’язок галактика—гало залишаються ключовими пояснювальними питаннями.

Mistele та ін. у 2024 році додатково використали слабке лінзування для виведення кругових швидкісних кривих ізольованих галактик і повідомили, що вони не мають явного спадання на масштабах у сотні kpc і навіть близько 1 Mpc, узгоджуючись із BTFR. Це показує, що слабке лінзування стає важливим зовнішнім зчитуванням для перевірки гравітаційного відгуку галактичного масштабу.

Тому цінність P1 не в тому, що він нібито першим обговорює RC і GGL разом. Його цінність у тому, що він поміщає їх в аудитовний протокол: фіксоване відображення, реєстр параметрів, замикання RC-only→GGL, негативний контроль shuffle і багатомодельний DM-стрес-тест P1A.

III. Що означає EFT у P1? Це не ефективна теорія поля


Тут EFT означає Теорію Нитки Енергії, а не звичну для фізики ефективну теорію поля (Effective Field Theory). У технічному звіті P1 EFT використано дуже стримано: вона не бере участі як завершена «остаточна теорія», а спочатку стискається до спостережуваної, підгінної й потенційно спростовної параметризації «середнього гравітаційного відгуку».

Простіше кажучи, P1 поки не обговорює всі мікроскопічні джерела додаткової гравітації й не намагається одним кроком довести весь каркас EFT. Він ставить вужче й жорсткіше питання: якщо на масштабі галактик існує певний середній додатковий гравітаційний відгук, чи здатен він спершу пояснити RC, а потім переносно передбачити GGL?

Яку частину EFT тестує P1?

P1 тестує «середню гравітаційну основу» (mean gravity floor): статистично стабільний середній внесок, який може переноситися між вибірками.

P1 поки не опрацьовує «шумову основу» (stochastic / noise floor): випадкові члени, індивідуальні відмінності або додаткову дисперсію, які могли б походити від мікроскопічніших флуктуаційних процесів.

P1 також не обговорює повний мікромеханізм, поширеність, часи життя чи глобальні космологічні обмеження. Це перший крок експериментів серії P, а не остаточний вирок.

IV. План серії P1: чому перший крок починається із «середньої основи»?


Серію P можна розуміти як спостережну програму пошуку для EFT. Вона не розкладає всі твердження одразу, а спершу виносить окремо той шар, який найпростіше перевірити на відкритих даних. Стратегія P1 — спочатку тестувати середній член: якщо середній гравітаційний відгук не може замкнутися навіть у переході RC→GGL, тоді розмова про складніші шумові члени чи мікромеханізми не має надійного входу.

Таблиця 1 | Пошарове позиціювання серії P

Рівень

Питання

Місце в P1

P1

Чи може середній гравітаційний відгук замкнутися в RC→GGL?

Головне питання поточного звіту

P1A

Якщо посилити бік DM, чи лишаються висновки стійкими?

Додаток B: стрес-тест DM 7+1 + DM_STD

Подальша серія P

Чи можна розширити протокол на більше даних, більше зондів і складніші систематичні похибки?

Напрям подальшої роботи

Глибше питання

Як середній член, шумовий член і мікромеханізм пов’язані між собою?

Поза межами висновків P1

V. Які тут дані? Що окремо повідомляють RC і GGL?


V.I. Криві обертання RC: «лінійка швидкості» в диску галактики

Криві обертання фіксують, як швидко газ і зорі обертаються навколо центра на різних відстанях від нього. Що вища швидкість, то сильніша доцентрова сила потрібна на цьому радіусі — тобто тим сильніша ефективна гравітація. P1 використовує базу SPARC: після попередньої обробки до аналізу внесено 104 галактики, 2295 точок швидкості й поділено їх на 20 RC-bin.

V.II. Слабке лінзування GGL: «гравітаційні ваги» на більших масштабах

Слабке лінзування галактика—галактика вимірює, як галактики переднього плану ледь викривляють світло фонових галактик. Воно відповідає проєктованому гравітаційному відгуку на більших, гало-масштабах і не залежить від деталей газової динаміки в диску. P1 використовує відкриті GGL-дані KiDS-1000 / Brouwer та ін. 2021: 4 біні зоряної маси, по 15 радіальних точок у кожному, разом 60 точок даних, із повною коваріацією.

V.III. Фіксоване відображення: чому 20 RC-bin → 4 GGL-bin є критично важливим?

P1 з’єднує 20 RC-bin із 4 GGL-bin за фіксованим правилом: кожен GGL-bin відповідає 5 RC-bin, а середнє береться з вагами за кількістю галактик. Це відображення однакове для всіх моделей і є жорстким обмеженням для тесту замикання та справедливого порівняння.

Чому не можна налаштовувати відображення заднім числом?

Якщо дозволити після факту обирати, «які RC-bin відповідають яким GGL-bin», модель могла б створити замикання просто добором відповідностей. P1 заздалегідь фіксує відображення 20→4 і навмисно руйнує його негативним контролем shuffle саме для того, щоб перевірити, чи справді сигнал замикання залежить від фізично обґрунтованої відповідності.

VI. Моделі та метод: що саме порівнює P1?


VI.I. Бік EFT: низьковимірний середній гравітаційний відгук

На боці EFT середній гравітаційний відгук описується низьковимірним додатковим швидкісним членом. Форму цього додаткового члена задає безрозмірна ядерна функція f(r/ℓ), де ℓ — глобальний масштаб, а амплітуда задається за RC-bin. Різні ядерні функції представляють різні початкові нахили, швидкості переходу й далекодійні хвости; вони потрібні для стрес-тестів робастності.

VI.II. Бік DM: головне порівняння в тексті й додаток P1A треба читати окремо

У головному порівнянні основного тексту DM_RAZOR — це мінімалізована й аудитовна базова NFW-лінія: фіксоване співвідношення c–M, без halo-to-halo scatter, адіабатичного стискання, feedback core, несферичності чи середовищних членів. Перевага такого дизайну — контрольована кількість ступенів свободи й легка відтворюваність; недолік — він не репрезентує всі LambdaCDM-моделі чи всі моделі гало темної матерії.

Тому в додатку B (P1A) бік DM перетворено на набір «стандартизованих стрес-тестів»: не змінюючи спільного відображення й протоколу замикання, поступово додають низьковимірні посилені гілки SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m і комбіновану базу DM_STD, залишаючи EFT_BIN як контроль. P1A варто читати так: порівняння не зводиться до одного мінімального DM-базису; групу поширених і аудитовних DM-механізмів вимірюють тією самою «лінійкою замикання».

Точне формулювання висновку в цьому тексті

Основний текст: серія EFT у головному порівнянні явно перевершує мінімальний DM_RAZOR.

Додаток B / P1A: під кількома низьковимірними аудитовними DM-посиленими гілками та стрес-тестом DM_STD частина спільної підгонки DM може покращуватися, але сила замикання не усуває переваги EFT_BIN.

Тому найобережніше формулювання таке: у межах даних, відображення, реєстру параметрів і протоколу замикання P1/P1A середній гравітаційний відгук EFT демонструє сильнішу міждану узгодженість; це не означає виключення всіх моделей темної матерії.

VI.III. Тест замикання: найважливіша експериментальна логіка P1

1. Виконати підгонку лише на RC й отримати набір апостеріорних зразків RC-only.

2. Не дозволяти повторного налаштування на GGL; безпосередньо використати апостеріор RC для прогнозу GGL.

3. За повною коваріацією обчислити GGL-оцінку прогнозу logL_true для правильного відображення.

4. Випадково переставити відповідність RC-bin→GGL-bin і обчислити негативний контроль logL_perm.

5. Відняти одне від одного й отримати силу замикання: ΔlogL_closure = <logL_true> − <logL_perm>.

Популярна аналогія

Тест замикання схожий на повторний іспит в іншій аудиторії: модель спершу навчається закономірності на іспиті RC, а потім відповідає на іспиті GGL. Якщо вона справді навчилася спільної закономірності, а не локального прийому, то має добре відповідати і після зміни аудиторії; якщо навмисно перемішати відповідність між аудиторіями, перевага має зникнути.

VI.IV. Перед технічними таблицями: чотири точки входу

Таблиця 5.4 | Маршрут читання наступної групи широких технічних таблиць

Вхід

Що дивитися

Чому це важливо

Таблиця S1a

Сумарний бал спільної підгонки RC+GGL

Відповідає на питання: «Якщо дивитися на два набори даних разом, чиє загальне пояснення сильніше?»

Таблиця S1b

Сила замикання, shuffle і сканування робастності

Відповідає на питання: «Чи може те, що вивчено з RC, перенестися на GGL?»

Таблиця B0

Визначення кількох DM-посилених гілок у P1A

Не дає звести P1 до «порівняння лише з мінімальним DM_RAZOR».

Таблиця B1

Табло замикання та спільної підгонки P1A

Перевіряє, чи зникає перевага замикання після посилення DM.

Примітка до верстки

Починаючи з наступної сторінки використано альбомну орієнтацію, щоб повністю зберегти широкі таблиці оригінального звіту, не вирізати стовпці й не стискати їх до нечитабельності. Основний текст уже подав читання для широкого читача; широкі технічні таблиці призначені для тих, кому потрібно звірити числа та модельні гілки.

Рисунок 0.1 | Процес тесту замикання P1 в одній схемі

Пояснення: верхній ланцюг — це «тест замикання» (підгонка лише на RC → прогноз GGL за апостеріором RC); нижній ланцюг — «спільна підгонка» (RC+GGL оцінюються разом). Праворуч справжнє відображення порівнюється з перемішаним, і з цього отримують силу замикання ΔlogL.

VII. Ключові технічні таблиці: головні таблиці оригінального звіту й таблиці P1A


Таблиця S1a | Основні метрики спільної підгонки (RC+GGL, Strict; збережено з оригінального звіту)

Модель (workspace)

W-ядро

k

Спільний logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

немає

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

немає

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

Таблиця S1b | Метрики замикання й робастності (Strict; збережено з оригінального звіту)

Модель (workspace)

Замикання ΔlogL (true-perm)

ΔlogL після shuffle-негативного контролю

Діапазон ΔlogL у скануванні σ_int

Діапазон ΔlogL у скануванні R_min

Діапазон ΔlogL у скануванні cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

Таблиця B0 | Визначення посилених DM-гілок у P1A (збережено з додатка B оригінального звіту)

Workspace

dm_model

Нові параметри (≤1)

Фізична мотивація (ядро)

Принцип реалізації (дружній до аудиту)

DM_RAZOR

NFW (фіксоване c–M, без scatter)

Мінімізована, аудитовна базова лінія гало LambdaCDM; використовується як строгий контроль для EFT

Спільне відображення фіксоване; реєстр параметрів строгий; baseline використовується лише для відносного порівняння

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

Співвідношення c–M має розсіяння; воно апроксимується однопараметричним log-normal scatter

≤1 новий параметр; спільне відображення зберігається; приріст замикання — критерій прийняття

DM_RAZOR_AC

NFW + Adiabatic Contraction (legacy)

α_AC

Падіння баріонів може спричиняти адіабатичне стискання гало; використано однопараметричну апроксимацію інтенсивності

≤1 новий параметр; відображення не змінюється; звітуються зміни AICc/BIC і приріст замикання

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

Зворотний зв’язок може формувати core у внутрішній зоні; використано однопараметричну апроксимацію масштабу core

≤1 новий параметр; замикання й негативний контроль у тому самому форматі; поліпшення RC-only не є єдиною метою

DM_HIER_CMSCAT

Ієрархічний c–M scatter + prior

σ_logc(hier)

Стандартніша ієрархічна форма c_i∼logN(c(M_i),σ_logc); водночас впливає на спільний апостеріор RC і GGL

Явний prior; латентні c_i маргіналізуються; модель лишається низьковимірною й аудитовною

DM_CORE1P

1‑параметричний core proxy (натхнено coreNFW/DC14)

log r_core

Однопараметричний core-проксі замінює головний ефект baryonic feedback, уникаючи високовимірних деталей зоретворення

Спирається на стандартну літературу; ≤1 новий параметр; пов’язано з тестом замикання

DM_RAZOR_M

NFW + nuisance для калібрування shear у лінзуванні

m_shear(GGL)

Ключову систематику на боці слабкого лінзування поглинає ефективний параметр, зменшуючи ризик «прийняти систематичну похибку за фізику»

nuisance явно обліковується; зворотний вплив на RC не дозволяється; результат оцінюється передусім за робастністю замикання

DM_STD

Стандартизований DM-baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

Три найпоширеніші закиди включено в один усе ще низьковимірний стандартизований baseline

Реєстр параметрів та інформаційні критерії звітуються разом; замикання — головна метрика; використовується як найсильніший оборонний DM-контроль

Таблиця B1 | Табло P1A (більше — краще; збережено з додатка B оригінального звіту)

Модельна гілка (workspace)

Δk

RC-only best logL_RC (Δ)

Сила замикання ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

Як читати таблицю B1 (табло P1A)

• Δk: додані ступені свободи (що більше, то складніша модель; складніше не означає краще).

• Головні дві колонки: сила замикання ΔlogL_closure(Δ) (що більше, то сильніша переносна самоузгодженість) і Joint best logL_total(Δ) (сумарний бал спільної підгонки).

• (Δ) у дужках означає різницю відносно DM_RAZOR, щоб порівняння було прямим.

• Головне питання цієї таблиці: чи зникає перевага замикання після «розумного посилення» DM-базису?

• Підказка для читання: спільний бал DM_STD помітно зростає, але сила замикання, навпаки, падає; EFT_BIN усе ще має вищу силу замикання.

Підсумок в одному реченні: у цьому наборі низьковимірних аудитовних DM-посилень краща спільна підгонка не автоматично дає сильніше замикання; замикання, тобто переносність, лишається ключовим критерієм.

VIII. Як читати головні результати?


VIII.I. Спільна підгонка: якщо дивитися на два набори даних разом, головне порівняння EFT має вищий бал

Таблиця S1a і рисунок S4 показують: за тих самих даних, того самого спільного відображення й приблизно того самого масштабу параметрів спільне ΔlogL_total серії EFT відносно DM_RAZOR становить 1155–1337. Для широкого читача це означає: за одним правилом оцінювання, коли RC і GGL беруться разом, головні моделі EFT набирають вищий сумарний бал.

VIII.II. Тест замикання: головний акцент P1 — переносність

Висока сила замикання означає, що модель, використовуючи лише параметри, виведені з RC, і не дивлячись знову на GGL, усе одно краще прогнозує GGL. У звіті P1 для EFT ΔlogL_closure дорівнює 172–281, а для DM_RAZOR — 127. Цей результат важливіший за фразу «кожна модель добре підганяється сама по собі», бо він обмежує свободу моделі на другому наборі даних.

VIII.III. Негативний контроль: чому «колапс сигналу» — це добра ознака?

Коли P1 випадково перемішує групову відповідність RC-bin→GGL-bin, сигнал замикання EFT падає до рівня 6–23. Для широкого читача цей крок є своєрідним «античітом»: якби перевага замикання виникала лише через код, одиниці, коваріацію чи випадковість підгонки, вона могла б зберігатися і після перемішування. Натомість перевага колапсує, отже вона залежить від правильного відображення.

Рисунок S3 | Сила замикання (більше — краще): середня перевага лог-правдоподібності для прогнозу RC-only → GGL.

Як читати цей рисунок

Цей рисунок є ядром P1. Що вищий стовпчик, то краще інформація, вивчена моделлю з RC, переноситься на GGL.

Серія EFT загалом вища за DM_RAZOR; це означає, що в експерименті «спершу вивчити RC, потім передбачити GGL» міжзондове замикання EFT сильніше.

Рисунок S4 | Перевага спільної підгонки (більше — краще): best logL_total для RC+GGL відносно DM_RAZOR.

Як читати цей рисунок

Цей рисунок показує сумарний бал після спільного аналізу RC і GGL.

Уся серія EFT значно вища за 0; це показує, що перевага EFT у головному порівнянні не є локальним ефектом однієї точки, а є загальною поведінкою спільного аналізу.

Рисунок R1 | Негативний контроль: після shuffle-групування сигнал замикання різко зменшується.

Як читати цей рисунок

Цей рисунок показує: щойно правильну відповідність RC↔GGL bin перемішано, сигнал замикання різко падає.

Це робить результат P1 схожим на реальну узгодженість у міжданому відображенні, а не на числовий збіг, який можна отримати за будь-якого відображення.

IX. Робастність і контролі: як P1 уникає заперечення «це просто гарна підгонка»?


Найлегше технічний звіт поставити під сумнів так: чи не походить перевага від певного налаштування шуму, окремої ділянки центральної зони, конкретної обробки коваріації або від перенавчання? P1 відповідає на це серією стрес-тестів.

Таблиця 2 | Як читати робастність і негативні контролі P1

Тест

Який сумнів він перевіряє

Як читати

Сканування σ_int

Якщо в RC є додаткова невідома дисперсія, чи лишається висновок стійким?

Після послаблення похибок RC порядок EFT і масштаб переваги лишаються стабільними.

Сканування R_min

Якщо не повністю довіряти центральним зонам галактик, чи лишається висновок стійким?

Після відсікання центральних зон EFT усе ще зберігає позитивну перевагу.

Сканування cov-shrink

Якщо оцінка коваріації GGL невизначена, чи лишається висновок стійким?

Коли коваріація стискається до діагональної матриці, перевага майже нечутлива.

Абляційна драбина

Чи EFT не підганяє дані силою зайвої складності?

Повний EFT_BIN є необхідним за інформаційними критеріями.

LOO-прогноз із відкладенням

Чи модель пояснює лише вже бачені дані?

Після відкладення GGL-bin модель усе ще показує сильну здатність до узагальнення.

RC-bin shuffle

Чи походить замикання зі справжнього відображення?

Після перемішування груп замикання падає, підтримуючи залежність від відображення.

Рисунок R2 | Діапазон ΔlogL_total під час сканування σ_int (більше — краще).

Як читати цей рисунок

Перевіряє, чи зберігається лідерство EFT після зміни налаштування внутрішньої дисперсії RC.

Рисунок R3 | Діапазон ΔlogL_total під час сканування R_min (більше — краще).

Як читати цей рисунок

Перевіряє, чи лишається перевага EFT стабільною після відсікання складних центральних зон.

Рисунок R4 | Діапазон ΔlogL_total під час сканування cov-shrink (більше — краще).

Як читати цей рисунок

Перевіряє, чи чутливий порядок моделей до зміни обробки коваріації слабкого лінзування.

Рисунок R5 | Абляційна драбина EFT_BIN (AICc; менше — краще).

Як читати цей рисунок

Перевіряє, чи повний EFT_BIN справді потрібен для пояснення даних, а не просто додає параметри.

Рисунок R6 | LOO: розподіл лог-правдоподібності для відкладених bin.

Як читати цей рисунок

Перевіряє, чи модель зберігає прогнозну силу на невідомих їй GGL-bin.

Рисунок R7 | Негативний контроль: shuffle-відображення помітно знижує mean logL_true у замиканні.

Як читати цей рисунок

Додатково показує з погляду mean logL_true, що замикання залежить від правильного міжданого відображення.

X. P1A: чому «кілька DM-моделей у додатку» є ключовим уточненням?


Цей розділ відповідає не на питання «чи EFT виграла лише проти мінімального DM_RAZOR?», а на інше: якщо посилити DM-базу в низьковимірному, відтворюваному й прозорому за параметрами діапазоні (P1A), чи зміняться висновки тесту замикання та спільної підгонки? Інакше кажучи, мета P1A — зменшити закид «ви просто обрали надто слабкий DM-базис» і перевести розмову до питання, чи зберігається різниця в замиканні під групою аудитовних DM-посилень.

Дизайн P1A не намагається вичерпати всі можливості моделювання гало в LambdaCDM і не перетворює бік DM на високовимірний, неаудитовний підгінний механізм. Він обирає низьковимірні, відтворювані й чітко обліковані посилення: розсіяння концентрації, адіабатичне стискання, feedback core, ієрархічний prior для c–M scatter, однопараметричний core-проксі, nuisance для shear-calibration у слабкому лінзуванні та комбінований DM_STD.

Головне читання P1A

Серед трьох legacy-гілок лише feedback/core дає невеликий чистий приріст сили замикання; SCAT і AC не дають чистого приросту замикання.

DM_HIER_CMSCAT, DM_RAZOR_M і DM_CORE1P мають дуже малий вплив на силу замикання або не показують помітного чистого приросту.

DM_STD може суттєво покращити joint logL, але сила замикання знижується; це вказує, що він переважно підвищує гнучкість спільної підгонки, а не переносну прогнозну силу RC→GGL.

EFT_BIN у таблиці B1 P1A і далі зберігає вищу силу замикання та перевагу спільної підгонки. Тому ключове твердження P1 не слід спрощувати до «виграно лише проти мінімального DM_RAZOR».

Рисунок B1 | Табло P1A: ΔlogL замикання та спільної підгонки відносно baseline (більше — краще).

Як читати цей рисунок

Цей рисунок показує поведінку кількох DM-посилених гілок відносно базової лінії.

Його значення не в тому, щоб «виключити весь DM», а в тому, що в межах низьковимірних аудитовних DM-посилень, обраних P1A, посилення DM не усуває переваги замикання EFT_BIN.

XI. Значення експерименту P1: чому це варто робити?


XI.I. Методологічне значення: поставити «міжзондове замикання» вище за «підгонку одного зонда»

Теорії галактичного масштабу найчастіше застрягають у суперечці про те, чи може певна модель підігнати певний набір кривих обертання. P1 піднімає питання на рівень вище: чи можуть параметри, вивчені з RC, передбачити слабке лінзування без повторного налаштування на GGL? Саме це перетворює P1 із «змагання підгонок» на «тест переносного прогнозування».

XI.II. Значення прозорості: зробити відтворюваний ланцюг частиною результату

Один із важливих внесків P1 полягає в тому, що він публікує дані, таблиці й рисунки, run-теги, негативні контролі, пакет відтворення та аудиторський ланцюг разом. Це важливо і для прихильників, і для критиків: дискусія може повертатися до тих самих відкритих даних, того самого відображення, тих самих скриптів і тих самих метрик, а не зводитися до порівняння гасел.

XI.III. Фізичне значення: сильний стрес-тест для напряму «гравітації без темної матерії»

У напрямі гравітації без темної матерії багато моделей можуть пояснити якусь частину кривих обертання або RAR. Складніше інше: водночас пройти зчитування слабкого лінзування й у негативному контролі показати, що сигнал залежить від правильного відображення. Значення P1 у тому, що він поміщає середній гравітаційний відгук EFT у протокол, схожий на «зовнішній іспит»: RC — тренувальний майданчик, GGL — поле перенесення, а shuffle — античіт.

XI.IV. Чи є це важливим експериментом для напряму гравітації без темної матерії?

Обережне формулювання таке: якщо обробка даних P1, пакет відтворення і протокол замикання витримають зовнішню перевірку, P1 можна вважати RC+GGL-експериментом замикання, який варто серйозно розглядати в напрямах гравітації без темної матерії / модифікованої гравітації. Його важливість не в гаслі «темну матерію спростовано», а в тому, що він пропонує міжзондовий критерій, який можна відтворити, оскаржити й розширити.

Чи вже існують рамки з так само високим прогнозним замиканням RC+GGL?

Існують споріднені рамки та спостережні традиції: MOND/RAR добре організовує багато явищ кривих обертання; робота зі слабкого лінзування RAR на KiDS-1000 також порівнювала MOND, emergent gravity Верлінде та моделі LambdaCDM. LambdaCDM, своєю чергою, може пояснювати частину слабколінзувальних і динамічних явищ через зв’язок галактика—гало, газові гало та моделювання зворотного зв’язку.

Точне твердження P1 не полягає в тому, що «у світі немає інших рамок, здатних пояснити RC+GGL». Воно полягає в іншому: за відкрито оприлюдненим самим P1 фіксованим відображенням, замиканням RC-only→GGL, негативним контролем shuffle, реєстром параметрів і багатомодельним DM-стрес-тестом P1A EFT повідомляє про сильнішу поведінку замикання.

Інакше кажучи, найцінніше місце для зовнішньої перевірки P1 — це запропонований ним конкретний і відтворюваний протокол порівняння. Чи зможуть у майбутньому MOND/RAR, LambdaCDM/HOD, hydrodynamical simulation або інші рамки модифікованої гравітації досягти того самого чи вищого бала замикання за тим самим протоколом — це саме той наступний крок, який варто зробити.

XII. Що P1 дозволяє висновувати, а чого — ні?


Таблиця 3 | Межі висновків P1

Можна висновувати

У межах RC+GGL-даних P1, фіксованого відображення та головного протоколу порівняння серія EFT має вищу спільну підгонку й силу замикання порівняно з мінімальним DM_RAZOR.

Можна висновувати

У межах низьковимірних аудитовних DM-посилень P1A кілька DM-посилень не усунули переваги замикання EFT_BIN.

Можна висновувати

Негативний контроль shuffle показує, що сигнал замикання залежить від правильного міжданого відображення, а не виникає за будь-якого відображення.

Не можна висновувати

Не можна стверджувати, що P1 уже спростував усі моделі темної матерії. P1A все ще не вичерпує несферичність, залежність від середовища, складний зв’язок галактика—гало, високовимірний зворотний зв’язок або повні космологічні симуляції.

Не можна висновувати

Не можна стверджувати, що повну теорію EFT вже доведено з перших принципів. P1 перевіряє лише феноменологічний шар середнього гравітаційного відгуку.

Не можна висновувати

Не можна стверджувати, що всі систематичні похибки виключено. P1 подає докази робастності лише в межах перелічених стрес-тестів і аудиту.

XIII. Поширені запитання: що найчастіше питає широкий читач


Питання 1: Чи означає це, що «темної матерії не існує»?

Ні. Висновки P1 мають бути обмежені даними, протоколом і контрольними моделями цього тексту. P1A вже йде далі за мінімальний DM_RAZOR, але все ще не репрезентує всі можливі моделі темної матерії.

Питання 2: Чи означає це, що «EFT уже доведено»?

Також ні. P1 перевіряє EFT як параметризацію середнього гравітаційного відгуку й показує сильнішу поведінку в замиканні RC→GGL. Мікроскопічний механізм і повна теорія не є висновком P1.

Питання 3: Чому не подати значущість одразу як σ-значення?

P1 використовує єдину оцінку правдоподібності, інформаційні критерії та різницю замикання. ΔlogL — це відносна перевага за тим самим правилом оцінювання; вона не тотожна одному σ-значенню.

Питання 4: Навіщо перемішувати RC-bin→GGL-bin?

Це негативний контроль. Справжній міжзондовий сигнал має залежати від правильного відображення; якби після перемішування він лишався таким самим сильним, це радше вказувало б на можливе зміщення реалізації або статистичний псевдосигнал.

Питання 5: Що P1 має зробити далі?

Поширити той самий протокол на більше даних, більше DM-контролів, складніші систематичні похибки й більше рамок модифікованої гравітації; особливо важливо, щоб зовнішні групи могли повторно перевірити результат за тією самою метрикою замикання.

XIV. Мінісловник термінів


Таблиця 4 | Мінісловник термінів

Термін

Пояснення в одному реченні

Крива обертання (RC)

Зв’язок радіус—швидкість у диску галактики; використовується для зворотного виведення ефективної гравітації в площині диска.

Слабке лінзування (GGL)

Вимірює середній розподіл гравітації/маси навколо галактик переднього плану через статистичне викривлення форм фонових галактик.

Тест замикання

Прогнозує GGL за апостеріором RC і порівнює з негативним контролем, де відображення перемішано.

Негативний контроль

Навмисно руйнує ключову структуру, щоб перевірити, чи зникає сигнал; використовується для відсіювання псевдосигналів.

Гало NFW

Профіль густини гало темної матерії, часто використовуваний у моделях холодної темної матерії.

Співвідношення c–M

Зв’язок між концентрацією c і масою M гало темної матерії; дозвіл на розсіяння впливає на гнучкість моделі.

DM_STD

Стандартизована DM-гілка стрес-тесту в P1A, що поєднує кілька низьковимірних DM-посилень і лінзувальний nuisance.

ΔlogL

Різниця лог-правдоподібності двох моделей за тим самим правилом оцінювання; додатне значення означає перевагу першої.

Коваріація

Матричний опис кореляцій між точками даних; для даних слабкого лінзування зазвичай потрібно використовувати повну коваріацію.

XV. Рекомендований маршрут читання та входи для цитування


1. Спочатку прочитайте розділи I–III цього тексту, щоб зрозуміти проблематику P1 і стримане позиціювання EFT у P1.

2. Далі перегляньте рисунки S3, S4 і таблиці S1a/S1b, щоб зрозуміти силу замикання, спільну підгонку та негативний контроль.

3. Якщо вас цікавить, чи «DM-базис не був надто слабким», переходьте прямо до розділу X і таблиці B1 / рисунка B1.

4. Для технічної перевірки зверніться до технічного звіту P1 v1.1, Tables & Figures Supplement і full_fit_runpack.

Основні архівні входи

Технічний звіт P1 (публікаційний рівень, Concept DOI): 10.5281/zenodo.18526334

Повний пакет відтворення P1 (Concept DOI): 10.5281/zenodo.18526286

Структурована база знань EFT (необов’язково, Concept DOI): 10.5281/zenodo.18853200

Примітка щодо ліцензії: технічний звіт використовує CC BY-NC-ND 4.0; повний пакет відтворення — CC BY 4.0 (орієнтуйтеся на технічний звіт і архів Zenodo).

XVI. Література та зовнішній контекст


McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.