全球最强开源语言模型诞生!瑞士用水力发电打造AI新霸主
2025-07-13分类:人工智能 阅读()
瑞士研究人员最近在阿尔卑斯超级电脑上成功训练了一个「完全开放」的大型语言模型(LLM),这一成就标志着AI 研究的一个重要里程碑。
阿尔卑斯超级电脑是欧洲最强大的高性能计算系统之一,专为AI工作负载而设计,于2024年底启用,配备超过10,000个NVIDIA GH200 Grace Hopper超级晶片,结合了优化的ARM CPU和GPU,能够高效地进行大规模训练。
这次训练过程耗费了约300万GPU小时,这一庞大的计算工作得益于阿尔卑斯超级电脑的尖端架构,提供了数个petaFLOPS的AI专用性能。研究人员计划在2025年夏季将这个LLM公开发布,并将其以Apache 2.0许可证的形式提供,强调开放性和可及性,以促进研究和开发。
除了其AI能力外,阿尔卑斯超级电脑还以环保著称,完全依赖水力发电,并采取措施减少二氧化碳排放,将冷却水重新利用于附近城市卢加诺的供暖。这项约1亿瑞士法郎的建设投资和每年3,700万瑞士法郎的运营费用,彰显了瑞士在推进AI技术方面的承诺,并以开放、可持续和公共利益为导向。
ETH苏黎世大学和瑞士联邦理工学院的研究人员在日内瓦举行的国际开源LLM建设者峰会上首次透露了这一消息。研究人员表示,这些模型将提供80亿和700亿参数的版本,并在150兆个数据标记上进行训练,预计能流利使用超过1,000种语言,其中约40%的训练数据来自英语以外的语言。
ETH苏黎世大学的教授马丁·雅吉表示,这种完全开放的做法与商业模型的封闭开发形成鲜明对比,旨在推动瑞士及欧洲的创新,并促进跨国合作。研究人员强调,这种透明度对于建立高信任度的应用和推进AI风险及机会的研究至关重要。
Tags: