Jumat, 10 Oktober 2025 17:04 WIB

AI Samsung kalahkan LLM raksasa dengan chip 7 juta parameter

Model AI Tiny Recursive Model (TRM) Samsung dengan 7M parameter unggul di tes penalaran logika, menantang raksasa seperti Gemini 2.5 Pro & DeepSeek.

Nur Chandra Laksana Penulis

Di era AI, konsensusnya jelas: bigger is better. Namun, Samsung baru saja hadir dengan penemuan yang disruptif abis. Sementara inovasi kamera Samsung mungkin sedang berjuang mencari arah, upaya AI mereka tidak bisa dibilang stagnan. Dalam sebuah makalah berjudul "Less is More: Recursive Reasoning with Tiny Networks," Samsung merinci arsitektur novel Tiny Recursive Model (TRM), sebuah model yang berhasil mengalahkan atau menyamai performa Large Language Models (LLM) raksasa yang berukuran hingga 10.000 kali lebih besar.

TRM hadir dengan ukuran yang sangat kecil, hanya mengandalkan 7 juta parameter. Jumlah ini merupakan proporsi yang sangat minim dibandingkan LLM besar yang populasinya dipenuhi miliaran parameter. Model ini istimewa karena hanya mengandalkan satu model dua lapis. Dengan sumber daya yang hanya sebagian kecil, TRM menantang asumsi industri bahwa hanya scale besar yang bisa memecahkan masalah logika yang rumit.

Inovasi utama TRM adalah arsitektur recursive reasoning. Model ini menggunakan keluarannya sendiri untuk menentukan langkah selanjutnya, menciptakan self-improving feedback loop. Dengan melewatkan setiap output melalui penalaran berulang (iterative reasoning), model ini mampu mensimulasikan arsitektur yang jauh lebih dalam. Hal ini dilakukan tanpa biaya komputasi atau memori yang besar.

Pendekatan Samsung ini secara konseptual mirip dengan seseorang yang membaca ulang draf mereka sendiri, memperbaiki kesalahan di setiap bacaan. Model ini secara progresif menghasilkan prediksi atau hasil yang lebih baik dengan setiap siklus rekursif. Pendekatan ini terbukti lebih unggul daripada pendekatan konvensional, di mana LLM sering kali "tersedak" pada masalah logika jika satu langkah saja salah, menyebabkan runtuhnya seluruh penalaran.

Dilansir dari laman Wccftech (10/9), hasil dari pengujian TRM sangat signifikan, menunjukkan efisiensi penalaran yang luar biasa pada tugas-tugas logika.

Sudoku-Extreme: Mencapai akurasi 87,4 persen. Angka ini sangat jauh, melampaui akurasi 55 persen yang diraih Hierarchical Reasoning Models.
Maze-Hard: Mencetak akurasi 85 persen.
ARC-AGI-1: Mencapai akurasi 45 persen.
ARC-AGI-2: Mencapai akurasi 8 persen.

Secara krusial, TRM baik melampaui atau mendekati performa berbagai LLM, termasuk DeepSeek R1, Google's Gemini 2.5 Pro, dan OpenAI's o3-mini, meskipun hanya menggunakan proporsi parameter yang sangat kecil.

Studi ini membawa kesimpulan penting: Keep it simple. Samsung menemukan bahwa mencoba meningkatkan lapisan model justru menurunkan kemampuan generalisasi karena overfitting. Sebaliknya, mengurangi lapisan tetapi meningkatkan jumlah rekursi justru meningkatkan performa TRM secara keseluruhan. Ini memperkuat argumen bahwa dengan inovasi arsitektural yang cerdas, model yang lebih kecil dapat melakukan penalaran lebih baik pada tugas-tugas spesifik.

Keberhasilan TRM dalam benchmark yang dirancang untuk mengukur kecerdasan abstrak ini menjadi tantangan serius bagi fokus industri yang meyakini scale adalah satu-satunya jalan menuju kemajuan AI. Ini menunjukkan bahwa kecerdasan tidak hanya muncul dari ukuran, tetapi dari algoritma yang terstruktur dan mampu melakukan self-correction secara iteratif.