最新成人网每10份音频就有8份被“胡编”？OpenAI语音转录器具被曝存要紧残障

发布日期：2024-11-07 03:06 点击次数：178

　　每10份音频就有8份被“胡编”？OpenAI语音转录器具被曝存要紧残障最新成人网

　　财联社10月28日讯(裁剪潇湘)生成式东谈主工智能界限的领军者OpenAI，曾吹嘘其东谈主工智能转录器具Whisper具有接近“东谈主类水平的安详性和准确性”。

　　相干词，跟着该转录器具在九行八业被越来越多地提高使用，其问题似乎也正驱动突显——笔据业内媒体对十多位软件工程师、确立东谈主员和学术辩论东谈主员的采访，如今Whisper所存在的一个要紧残障已愈发退却忽视：它很容易会臆造大段笔墨，以致是整段句子。

　　这些业内巨匠默示，一些臆造出的笔墨——在行业内被称为“幻觉”，可能包括种族言论、暴力措辞，乃至悉数杜撰出的医疗淡薄。

　　巨匠们越来越挂牵这种“胡编乱造”可能酿成严重效果，因为Whisper现时正被全球多个行业用于翻译和转录采访本体、生成文本以及为视频制作字幕。诚然OpenAI曾劝诫不应在“高风险界限”使用该器具，但现在一些好意思国医疗中心皆正驱动使用基于Whisper的器具，来记载患者与医师间的对话。

　　据频繁使用Whisper的辩论东谈主员和工程师默示，他们在责任中频繁会碰到该器具出现“幻觉”。举例，密歇根大学的又名辩论东谈主员在辩论世界会议的转录准确率时发现，他所审核的每十份音频转录中，便有八份存在“幻觉”。

　　一位机器学习工程师则称，在他分析的100多个小时的Whisper转录中，他泉源发现节略有一半存在“幻觉”。第三位确立东谈主员指出，在他用Whisper创建的26000份记载中，险些每一份皆发现了胡编乱造的状态。

　　即使是在那些录制精采的节略音频样本里最新成人网，问题也一经存在。在最近的一项辩论中，蓄意机科学家们在审查的突出13000个澄莹音频片断中发现存187个存在“幻觉”问题。

　　辩论东谈主员默示，这种趋势将导致在数百万段灌音中出现无独有偶的荒唐转录。

三级小说

　　效果严重

　　曾在拜登政府指引白宫科技策略办公室责任的Alondra Nelson默示，这种荒唐可能会酿成“至极严重的效果”，尤其是在病院里。

　　现在，包括明尼苏达州的曼卡托诊所和洛杉矶儿童病院在内的突出30000名临床医师和40个卫生系统，已驱动使用法国AI调整公司Nabla基于Whisper打造的器具。

　　Nabla公司的首席技能官Martin Raison默示，该器具笔据医学语言进行了微调，以转录和追忆医师与病东谈主间的互动。该器具转录的就诊记载现在已多达约700万次。该公司官员还指出，他们知谈Whisper会产生幻觉，并正在勉力惩处这个问题。

　　现在担任普林斯顿高级辩论院教悔的Nelson默示，“莫得东谈主但愿出现误诊。(该界限)应该有更高的法式。”

　　现在，Whisper还被用于为聋东谈主和听力禁绝者制作字幕——这是一个特殊容易因出现荒唐转录而堕入窘境的东谈主群，因为聋东谈主和听力禁绝者悉数无法识别“避讳在通盘文本中”的臆造本体。

　　这种幻觉在Whisper中的浩荡存在，已促使稠密巨匠、想法者和OpenAI前职工敕令好意思国政府酌量制定东谈主工智能端正。他们指出，OpenAI至少需要惩处这一残障。本年2月因挂牵公司的发展宗旨而从OpenAI去职的工程师William Saunders就默示，若是OpenAI惬心优先惩处这个问题，这个问题似乎是不错惩处的。而若是你恒久把它放在那边，而东谈主们对它的功能过于自信，并把它集成到通盘这些其他系统中，那就有艰难了。

　　诚然大巨额确立东谈主员皆以为转录器具不成幸免会拼错单词或出现其他荒唐，但不少工程师和辩论东谈主员默示，他们从未见过其他东谈主工智能转录器具像Whisper不异容易产生幻觉。

　　现在，该器具已被集成到OpenAI旗舰聊天机器东谈主ChatGPT的某些版块中，同期亦然甲骨文和微软云蓄意平台的内置家具，为全球数千家公司提供做事。它还可用于将文本转录和翻译成多种语言。

　　仅在上个月，开源东谈主工智能平台HuggingFace上的一个Whisper最新版块就被下载了420多万次。该平台的机器学习工程师Sanchit Gandhi默示，Whisper是最流行的开源语音识别模子，从招呼中心到语音助手，皆内置了Whisper。

　　康奈尔大学教悔Allison Koenecke和弗吉尼亚大学教悔Mona Sloane，现在已辩论了他们从卡内基梅隆大学的辩论贵寓库TalkBank中取得的数千个节略音频片断。他们发现，近40%的幻听是无益的或令东谈主担忧的，因为语言者的应允可能被曲解或诬蔑。

　　辩论东谈主员并不细目Whisper和雷同器具产生幻觉的原因，但软件确立东谈主员默示，这些胡编乱造时时发生在出现停顿、配景声息或音乐播放时。OpenAI此前在网上表露的信息中曾淡薄，不要在有磋议情境中使用Whisper，因为准确性上的残障会导致限度上的赫然残障。

　　而针对最新爆料最新成人网，有OpenAI发言东谈主陈述称，OpenAI会在接下来的模子更新中加入相应的响应机制。

最新成人网每10份音频就有8份被“胡编”？OpenAI语音转录器具被曝存要紧残障

热点资讯

相关资讯

最新成人网 每10份音频就有8份被“胡编”？OpenAI语音转录器具被曝存要紧残障

热点资讯

相关资讯

最新成人网每10份音频就有8份被“胡编”？OpenAI语音转录器具被曝存要紧残障