前OpenAI CTO穆拉蒂推出Tinker API,革新大模型微调
穆拉蒂的Thinking Machines实验室正式推出Tinker API,旨在简化大型语言模型(LLM)的微调工作。
前OpenAI首席技术官米拉·穆拉蒂(Mira Murati)创立的人工智能初创公司Thinking Machines Lab于近日揭晓了其首款商业产品——Tinker。Tinker是一个基于Python的API,专为研究人员和开发者设计,其核心目标是大幅简化大型语言模型(LLM)的复杂微调过程。
这项基于云的服务目前正处于私有测试阶段,它赋予用户定制AI模型的能力,而无需承担管理昂贵的GPU基础设施或复杂的分布式计算系统带来的负担。穆拉蒂在社交媒体平台X上宣布:“Tinker为研究人员带来了前沿工具,提供清晰的抽象层,用于编写实验和训练工作流,同时有效处理分布式训练的复杂性。”
Tinker支持超过六种主流开源模型,其中包括Meta的Llama系列和阿里的通义千问(Qwen)系列。用户仅需一行代码,即可在小型模型与大型模型之间灵活切换。该服务采用了低秩适配(LoRA)技术,通过允许多个训练任务共享计算资源,显著降低了硬件需求和运营成本。
顶尖研究机构的早期采纳与显著成效
You Might Also Like
在正式对外公布之前,Tinker已经获得了众多顶尖研究团队的青睐。普林斯顿大学的戈德尔(Goedel)团队利用该平台训练数学定理证明器,在形式化数学基准测试中取得了88%的准确率,而其所用的训练数据仅为常规数据量的20%。斯坦福大学的罗茨科夫(Rotskoff)实验室则通过Tinker,将化学推理模型的准确率在复杂分子任务上从15%提升至50%。
加州大学伯克利分校的SkyRL研究小组利用Tinker的底层基础设施抽象能力,成功开展了多智能体强化学习实验,这类实验若无Tinker的简化,以往将难以实现。专注于AI安全的Redwood Research组织也使用Tinker,对Qwen3-32B模型进行了微调,以应对复杂的控制任务。
Redwood Research的Eric Gan指出:“Tinker无疑比从头开始进行强化学习要简单得多。” 该工具还获得了包括前OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在内的多位AI领域知名人士的赞誉。卡帕西称其为“一种更明智的方法”,它能让用户“获得大约90%的算法控制权,同时减轻约90%的基础设施挑战”。
OpenAI血脉加持,打破纪录的初创公司
Thinking Machines Lab被视为硅谷最具雄心的人工智能企业之一。该公司在今年7月以120亿美元的估值完成了20亿美元的种子轮融资。本轮融资由Andreessen Horowitz领投,并获得了英伟达(Nvidia)、AMD及其他多家科技巨头的参与,这使其成为硅谷历史上规模最大的种子轮融资之一。
穆拉蒂与其他OpenAI前核心成员共同创立了这家公司,其中包括曾主导ChatGPT强化学习开发的约翰·舒尔曼(John Schulman)。这支团队离开OpenAI是由于此前公司内部的组织动荡,同时也反映了一个更广泛的趋势:即知名研究人员正纷纷离开成熟的AI实验室,转而寻求更开放的AI开发路径。
该服务在测试阶段将免费开放,预计未来几周内将推出基于使用量的计费模式。
(来源:前途科技)