Малий, але геніальний: як модель Samsung з 7 млн параметрів обігнала гігантів ШІ

10.10.2025 1 хвилин Автор: Newsman

Дослідниця з лабораторії Samsung SAIT AI Lab продемонструвала, що маленькі моделі можуть бути не менш потужними за гігантів. Її Tiny Recursion Model (TRM) із лише 7 мільйонами параметрів перевершила такі системи, як Gemini 2.5 Pro, Claude Opus 4 і навіть GPT-5 (Low) у вирішенні складних завдань логіки та рекурсії. TRM побудована на принципі рекурсивного мислення — модель не просто видає відповідь, а кілька разів удосконалює її, передаючи результати попереднього кроку назад у власну нейромережу. Такий підхід дозволяє системі вчитися з власних помилок у реальному часі, мінімізуючи потребу в мільярдах параметрів.

У тестах ARC-AGI-1, які перевіряють здатність ШІ розв’язувати задачі, зрозумілі людям, але складні для машин, TRM отримала 45%, що майже дорівнює показнику GPT-5 (Low). А у складнішому ARC-AGI-2 вона набрала 8%, залишивши позаду провідні комерційні моделі.

Найвражаючішим стало співвідношення ціни до ефективності: виконання завдань коштувало лише частку цента, тоді як інші системи витрачали від 25 центів до 1 долара.

Авторка моделі, Алексія Жолікеур-Мартіно, зазначає:

> «Ідея, що лише величезні моделі з мільярдами параметрів можуть вирішувати складні проблеми, — це пастка. Іноді в штучному інтелекті “менше — означає більше”.»

Розробка TRM — це спроба повернути ШІ до ефективності, а не безконтрольного масштабування. За останні роки провідні компанії інвестували мільярди доларів у тренування великих мовних моделей, але такі системи часто мають проблеми з гнучкістю, енергоспоживанням і перенавчанням.

Samsung показала, що зосередженість на алгоритмічній оптимізації може дати ті ж результати, що й великі LLM-системи, при цьому витрачаючи тисячі разів менше ресурсів.

Робота Samsung стала яскравим доказом того, що майбутнє ШІ — не лише у розмірі, а у розумі. Концепція Tiny Recursion Model може докорінно змінити підхід до створення нових систем — від мобільних асистентів до промислових аналітичних інструментів.

Якщо цей напрям отримає розвиток, то вже за кілька років “маленькі ШІ” можуть замінити великі хмарні моделі, зробивши інтелект доступним навіть на простих пристроях.