麻豆 91
IT 之家 9 月 14 日音书萝莉 幻塔,科技媒体 The Decoder 昨日(9 月 13 日)发布博文,报说念称在 OpenAI 自家的"审视框架"(Preparedness Framework)下,将最新发布的 o1 AI 模子归类为"中等风险"(medium risk)。
审视框架简介
IT 之家曾于 2023 年 12 月报说念,OpenAI 开荒了新的"审视"(Preparedness)团队,并淡薄"审视框架"指点指标。
审视团队将反复评估 OpenAI 最先进、尚未发布的 AI 模子,凭据不同类型的感知风险评为四个品级,从低到高治安是"低"、"中"、"高"和"严重"。凭据新的指点指标,OpenAI 将只推出评级为"低"和"中"的模子。
OpenAI o1 模子
萝莉 幻塔
OpenAI 公司在官方新闻稿中暗示,最终笃定 o1 模子归类为"中等风险"主要有以下两个原因:
类东说念主推理才略
o1 模子展现出访佛东说念主类的推理才略,并能在访佛主题上产生与东说念主类撰写一样令东说念主深信的论点。
这种劝服力并非 o1 专有,先前的 AI 模子也已展示出此才略,随机甚而杰出东说念主类进展。
可提拔制作生物兵器
评估裸露,o1 模子能提拔众人复制已知生物兵器威迫。
OpenAI 声称,o1 模子显耀擢升数学和科学规模的才略。
举例,在全好意思奥林匹克数学队()USA Mathematical Olympiad,简称 USAMO)的预选赛中,新模子的进展能置身好意思国前 500 名学生之列,况兼在物理、生物和化知识题的基准测试中,准确度跨越了东说念主类博士水平。
韩国伦理电影OpenAI 初度将其模子在化学、生物、辐射性和核兵器(CBRN)风险方面的评级定为"中性"萝莉 幻塔。这些模子的发布伴跟着对其潜在危急的屡次申饬。