2015-11-12 00:00:00少芬 速录速记
在速录群中,经常有人推销所谓的“音频转换文字”的软件;在会议现场,经常会被与会嘉宾问到:现在都有语音识别了,你们速录师是不是该下岗了……这导致很多有志于速录事业发展的青年才俊对语音识别代替人工速录表示极大的担忧。今天我也就语音识别与人工速录谈谈自己的看法。
虽然从发展的眼光看,人工智能代替纯手工速录是历史发展的必然趋势,但从现有的科学技术来看,路还很长。
十年前,当我打算重新投身于速录事业之际,和很多人一样,对速录的可持续发展持有疑虑,对语音识别代替速录技术同样表示担心。恰逢同学回国,聊起此事。同学对投身速录事业表示赞赏,并补充说:美国的速录师从业人数非常多,速录技术应用非常广泛。还举例说:一千人参加的会议,只要有一位听障人士,会务组必须单独为其配备速录师。谈到语音识别对速记、速录的影响(当年有机构开发这类软件),美国的语音识别技术发展非常超前,但是美国现有的语音识别技术也只限用于军事、医疗这种标准化程度非常高的行业。
抛开语种的差别,汉语言的博大精深咱不赘述。单从中国的软件技术与美国相比,差距可不止是一点点。美国的语音识别技术也只是在极少数专业领域进行发展和应用,中国的语音识别技术怎么可能在短时间内完成这种华丽转身呢?
有人可能会说,你同学说的为什么要听?他说的就代表权威吗?所以必须得说明,该同学当时受聘于美国知名IT公司,从事语音识别技术研发工作,方向是英语语种,其夫人受聘于同一家公司,从事同类工作,方向是阿拉伯语系。
可能上面的故事不足以让大多数人顿悟,下面我们就以实战进行分析。了解速录的人都知道,速录师有国家标准,标准里的关键词是速度、准确率。现在就以这两个关键词为基础,结合影响会议的相关因素,对语音识别与人工速录进行综合比对。
※ 错字数以A4纸为例,满页5号字,约1500字。
分析:
1.准确率
相信绝大多数一线速录师会议记录现场交稿的准确率不低于99%(95%以上只是行业标准),但即使99%以上的准确率(即一页纸错15个字以下),很多严苛的单位还是相当不满意。所以大多数时候,速录师会把错误率控制在千分之三以下(主要是专业术语的误听)。
反观语音识别,语音识别推销的广告词往往是“高辨识度,准确率高达80%以上”。我想请问,80%的准确率(即单页错300个字)这还能算是文稿吗?
2.速度
两者都能同步记录。
3.会场环境
当会场环境较恶劣时,比如话筒音量不够或无话筒,离音源较远,夹杂着各种声音,我不知道软件该如何去识别?但我知道,我们速录师能。
4.文稿美观度
带过实习生的速录师都知道,很多实习生对于分段特别不适应,所以改他(她)的文稿特别累。光分段就会让你好好地去重听整个音频,因为不分段的文稿客户是不会满意的。而语音识别恰恰就是永远不分段。
一线速录师的文稿一定会做到分段、分层次、分角色,而且会做到段落清楚,层次分明。角色,我特别提出来,多人对话、现场激烈讨论这种场景,是我们速录师碰到的常态,电视节目“扒词”是要分角色的,但不管哪种情况,角色绝不会自报家门,全靠速录师同步添加,这一点所谓的语音识别永远做不到。
通过分析,高下立判,优劣一目了然。
一点拙见,希望对想步入速录大家庭的你能有所帮助。
更希望有超强的语音识别脱颖而出,虽然目前不可能。
79
人