Startupi i Mira Muratit prezanton Tinker, platformë për trajnimin e modeleve gjuhësore

Startup-i Thinking Machines, i themeluar nga ish-CTO e OpenAI, Mira Murati, ka prezantuar produktin e tij të parë, Tinker – një API që synon të thjeshtësojë trajnimin e modeleve të mëdha gjuhësore.
Qëllimi i Tinker është të mundësojë zhvillimin e modeleve open source, edhe për ekipe që nuk disponojnë burime kompjuterike të mëdha. Platforma është dizajnuar për studiues dhe zhvillues që duan të trajnojnë ose përshtatin modele ekzistuese pa u shqetësuar për menaxhimin kompleks të infrastrukturës.
Në fazën fillestare, Tinker mbështet modele të hapura nga Meta (Llama) dhe Alibaba (Qwen), përfshirë edhe variante shumë të mëdha si Qwen-235B-A22B. Ndërrimi midis modeleve bëhet thjesht duke modifikuar një varg të vetëm në kod, ndërsa platforma kujdeset për menaxhimin e burimeve, tolerancën ndaj gabimeve dhe planifikimin e ngarkesës.
Platforma përdor teknologjinë LoRA (Low-Rank Adaptation), që lejon kryerjen e trajnimeve paralelisht në të njëjtën pajisje, duke ulur kostot dhe duke rritur efikasitetin. Për më tepër, Tinker Cookbook ofron një bibliotekë me metoda standarde për periudhën pas-trajnimit, duke ndihmuar përdoruesit të shmangin gabimet më të zakonshme gjatë përshtatjes së modeleve.
Aktualisht, Tinker është në fazën beta të mbyllur dhe përdoruesit mund të regjistrohen falas në listën e pritjes. Çmimet bazuar në përdorim pritet të njoftohen në javët e ardhshme.
Me këtë nismë, Murati dhe ish-kolegët e saj nga OpenAI – përfshirë John Schulman, Barret Zoph dhe Luke Metz – tregojnë besimin se modelet e hapura të përshtatura mund të jenë më fleksibël dhe më ekonomikisht të leverdisshme krahasuar me modelet e mbyllura si GPT-5.