语音历史
① 汉语语音的历史发展
古人讲话的声音不可能保留到今天,研究语音的历史发展,只能依靠古代的文字材料。汉字本身保留了大量的古代语音信息,古代诗歌的用韵和中古以后出现的各种韵书提供了极其丰富的语音资料,从现代方言的比较研究中更可以看出汉语语音演变的种种线索。此外,古代的音译词以及汉语和其他汉藏语系语言的比较也都能帮助人们了解汉语语音的历史发展情况,但是这方面的研究工作还没有真正展开。
对汉语语音历史的研究传统称为“音韵学”,有悠久的历史。一般把汉语语音的发展分为 4个时期:①上古音时期──先秦至魏晋(约公元前10~公元 5世纪);②中古音时期──南北朝至唐宋(5~13世纪);③近古音时期──元代和明代(13~17世纪);④现代音时期──清代至现代(17~20世纪)。对各时期的起讫时代目前还有一些不同看法,但前后相差并不很大。每个时期都长达数百年甚至上千年,在一个时期内自然还有不同阶段的变化,各时期的方言分歧情况目前也了解很少,因此,研究古代各时期的语音,一般只能选择具有代表性的语音资料作为各时期语音系统的代表,然后旁及其他材料。
从上古音到现代音的2000多年时间内,汉语语音的基本结构并没有改变,即音节分为声母、韵母和声调3部分,韵母又分为韵头、韵腹和韵尾。2000多年来汉语语音的演变主要是声母、韵母和声调内部的变化,这些变化在现代方言中有时还能反映出来,例如上古音和中古音都有鼻音韵尾【-m】,到现代还保留在广州话和其他一些方言里。 一般以《诗经》韵脚和谐声字所反映的语音系统作为代表。《诗经》并非一时一地的作品,谐声字是用声旁表音的字(如“途、除、徐、叙、斜”都用声旁“余”表音),来源更要复杂一些,但这两种材料反映的语音系统是相当一致的。上古音距今已逾千年,语音资料也较零散,目前只能推测出上古音系的基本轮廓,对其中的细节还有待进一步研究。
上古声母共有30个左右。其中【p】、 【p‘】、 【m】、 【t】、【t嶉】、【n】、【l】、【k】、【k‘】、【嬜】、【x】、【堭】、【堭‘】、【s】是从上古直到现代绝大多数方言都存在的声母,表现了汉语声母的历史继承性。上古浊塞音声母 【b】、【d】、【ɡ】和浊塞擦音【扷】也还保留在现代一些方言里,其余十几个声母的性质则各家说法很不一致。上古很可能还存在 【kl】、【pl】之类的复辅音声母,例如在谐声字中,舌根音声母【k】、【k‘】往往和边音声母【l】互谐,“各”既可以作“格、阁、客”的声符,也可以作“洛、路、略”的声符,这些字很可能原来都是由【kl】之类的复辅音演变来的。对上古音是否有复辅音以及有多少复辅音,目前还有种种不同看法。
根据《诗经》用韵和谐声字的情况,传统把上古韵母分为若干韵部,用一个汉字来代表,如“之部、幽部”等等,上古韵部共有30个左右。同韵部的字只是韵腹和韵尾相同,韵头可以不同,因此每个韵部实际不只包含一个韵母。根据韵尾的不同可以把上古韵部分为阴、阳、入3大类:有鼻音韵尾【-m】、【-n】、【-嬜】的是阳声韵,有清塞音韵尾【-p】、【-t】、【-k】的是入声韵,其余的都属于阴声韵。如果韵腹相同,阴阳入 3类往往可以相互押韵或谐声,如《诗经·郑风·女曰鸡鸣三章》“知子之来之,杂佩以赠之”中,“来”和“赠”押韵,就是因为这两个字在上古韵腹相同,都是 【?amp;#91;】,只是“来”属于阴声韵,“赠”则属于有鼻音韵尾【-嬜】的阳声韵,这种押韵现象传统称为“阴阳对转”。
大多数上古韵母的读音和现代相去甚远,和中古也有很大区别。例如“姑”现代韵母是 【u】,中古相同或近似,上古时韵母则可能是【a】;“台”现代韵母是【ai】,中古也是类似的复元音,上古时韵母则可能是【?amp;#91;】 。也有一些韵母如【an】、【?amp;#91;n】、【a嬜】、【?amp;#91;嬜】等从上古经中古到现代变化不大,象“班” 【pan】和“登”【t?amp;#91;嬜】 等字的读音2000多年来并没有显著的改变,但这类字究竟是少数。目前对上古音韵头的多少、韵部的分合以及阴声韵是否也有辅音韵尾等问题有种种不同看法,还远没有取得一致的意见。
现存的上古音语音资料不能系统地反映出上古声调情况,历来对上古声调的看法分歧也最大。目前较有影响的有3种意见:①上古和中古一样,分为“平、上、去、入”四声;②上古没有去声;③上古只有平声和入声,但各分长短两种。近年来从汉藏系语言的比较研究中又产生一种新意见,认为汉语在远古时期可能并没有声调的分别,声调是远古时期不同的韵尾辅音脱落或保存才逐渐产生的。 一般以隋唐时期盛行的韵书《切韵》的语音系统作为代表。魏晋南北朝是从上古音向中古音转变的时期,南北朝时已经出现了许多供作诗押韵用的韵书,对当时的语音系统做了一定的分析和归纳,隋代陆法言集各家之大成,于 601年编成《切韵》一书。《切韵》的原本和它以前的韵书今已佚,现存的《切韵》都是后人的增订本,而且大多是残卷。目前流传最广的完整增订本是宋代陈彭年等编的《大宋重修广韵》,《广韵》对《切韵》的增订主要在字数和释义,对《切韵》的语音系统并没有重大的改动,现在研究《切韵》音系一般就都以《广韵》为主要依据。《广韵》把当时的语音系统分析归纳为四声、206 韵,每韵内又根据声母的不同分为若干小韵,这个语音系统是否代表当时一时一地之音,目前尚无定论,但它能分门别类详细列举出隋唐时期声母、韵母和声调的情况,是研究中古音最重要的语音资料。
《切韵》并没有系统地列出它的声母系统,根据后人分析归纳,大体上是和传统的三十六字母相当的。三十六字母可能起源于唐末,到宋代经过不断补充修订,基本上能代表当时的声母系统。每个字母用一个汉字来代表,至于它们的实际读音,经过多年研究,目前已大致取得一致的意见。但为了便于说明中古的声母系统,目前一般仍沿用三十六字母的名称,例如,用“帮、滂、并、明”代表中古声母【p】、【p‘】、【b】、【m】,用“端、透、定、泥”代表中古声母【t】、【t嶉】、【d】、【n】等。上古声母有相当一部分仍保存在中古音中,但大都经过了较为复杂的分化或合并的过程,并不完全是一对一的关系。
《切韵》把不同声调的韵母算作不同的韵,每个韵用一个汉字来代表,例如“东韵”、“江韵”、“鱼韵”、“真韵”等。在计算中古韵母时,如果只是声调不同,就只能算是一个韵母,例如“之韵”、“止韵”和“志韵”的分别只在声调,实际上只是一个韵母。《切韵》共列出193个韵,《广韵》增订为206韵,除去声调的分别不计,只有90多个韵。当时的分类不大重视韵头的作用,有时把不同韵头的韵母合并成一个韵,例如,“删韵”就包括开口呼和合口呼两类韵母,可是“寒韵”和桓韵又根据开口呼和合口呼的不同分成两韵。如果把该分开的韵母都分列出来,实际上共有150多个不同的韵母,这说明《切韵》所记录的韵母系统是相当复杂的。
中古音的韵头只有 【i-】和 【u-】,但隋唐时期韵头【i-】可能还分为长短两类,这样就有了三种不同的韵头。中古音的韵腹元音非常丰富,这是中古韵母多达150多个的主要原因。近几十年对中古韵腹元音的实际读音做了相当细致的研究和推测,其中大部分已经取得了比较一致的意见。中古音的韵尾继承了上古阴声韵、阳声韵和入声韵的分别。阴声韵的韵母除没有韵尾的(如“歌韵”)以外,还包括元音韵尾【-i】(如“灰韵”)和【-u】(如“豪韵”)。中古阳声韵的鼻音韵尾和入声韵的清塞音韵尾与上古相同。在《切韵》的韵母系统中,入声韵和阳声韵相配,即【-m】和【-p】相配,【-n】和【-t】相配,【-嬜】和【-k】相配,例如东韵”【-u嬜】和屋韵【-uk】相配,删韵”【-an】和“辖韵”【-at】相配,“衔韵”【-am】和“狎韵”【-ap】相配等等,形成相当整齐的局面。
中古音的声调分为“平声、上声、去声、入声”4类。《切韵》以声调为纲,在四声之下分列各韵,后代韵书一般都遵循这种编排方法。平声、上声和去声的分别主要在音节的高低升降不同;入声则是韵尾收【-p】、【-t】、【-k】的发音短促的入声韵,和另外三声的阳声韵相配,例如“东、董、送、屋四韵的分别就在于“平、上、去、入”四声不同,至于阴声韵如之、止、志、“鱼、语、御”等则只有“平、上、去”三声。从中古到现代四声的发展和声母的清浊关系很密切,为了便于说明这种关系,习惯上把中古的四声分为阴阳两类:中古是清音声母的称为“阴平、阴上、阴去、阴入”,如“官、管、灌、括”;中古是浊音声母的称为“阳平、阳上、阳去、阳入”,如“郎、朗、浪、乐”。
在唐初,已有人批评《切韵》分韵过细,不利使用,说明《切韵》的语音系统已与当时的口语不尽相合。从《广韵》开始,已在《切韵》的一些韵目下注明与某韵“同用”,实际就是承认这两个韵并没有明显的区别。到宋末元初时,为了便于作诗,一些韵书根据《广韵》“同用”的办法,索性把206韵合并为106韵,这106韵从此成为做旧体诗押韵的规范。最早合并的是平水人刘渊主持刊行的《壬子新刊礼部韵略》(1252),因此世称这106韵为“平水韵”。平水韵主要只是把《广韵》韵目中同用各韵加以合并,并不能真正代表宋元时期口语的语音。 一般以元代周德清所编《中原音韵》的语音系统作为代表。《中原音韵》成书于1324年,正是元代戏曲盛行的时期,周德清根据当时北曲作家用韵的情况归纳整理成书,成为写作北曲用韵的准绳,对中国古代戏曲创作有很大影响。《中原音韵》是专为戏曲而作的,因此能跳出《切韵》系统韵书的窠臼,记录下活跃于元代舞台上的北方语音系统。至于这个语音系统是否能代表当时的元大都(今北京)的方言,目前尚有不同看法,但它无疑是现代北方官话的源头,代表了汉语语音发展的一个重要阶段。
《中原音韵》所代表的近古音语音系统比《切韵》所代表的中古音语音系统简单得多,已经相当接近于现代北京话。《中原音韵》改变了《切韵》以声调为纲的编排方法,改为以韵为纲,各韵之下分列声调,然后再分为若干小韵,同音字都列在同一小韵内,并没有单列声母。根据小韵的分布情况来分析,《中原音韵》可能共有20个声母(不包括零声母),和现代北京话已很近似。汉语的声母系统从中古到近古大大简化,主要是因为中古大部分浊音声母到近古变成了清音,除了【m-】、【n-】、【l-】等少数浊音声母外,其余都变成清音,和原来的清音声母合并,例如“步”【b-】并入“布”【p-】,“在”【扷-】并入“再”【堭-】,“似”【z-】并入“四”【s-】等。
《中原音韵》把韵母分为19个韵部,以两个汉字命名,如“东钟、江阳、支思”等,这只是韵母的大类,各韵部内还包括韵头不同的韵母。19个韵部实际共包括40多个韵母,只有中古韵母的 1/3左右,这主要是因为中古入声韵到近古已经全部消失,和阴声韵完全合并。此外,中古有不少韵母的韵腹元音非常接近,到近古也合并在一起了,例如“东、冬、钟”在中古本是3个韵,到近古就合为一韵。近古音的韵头可能只有【i】和【u】,韵头【y】 当时是否已经出现,目前还有不同看法,但至迟到明代就已经形成了现代四呼的局面。中古的鼻音韵尾【-m】、【-n】、【-嬜】和元音韵尾【-i】、【-u】在《中原音韵》中仍完整地保存,但不久【-m】就和【-n】合并,只留下了【-n】、【-嬜】两套鼻音韵尾。中古的塞音韵尾【-p】、【-t】、【-k】由于入声韵消失,也不复存在,其中有不少并入元音韵尾【-i】、【-u】,如“麦”并入“卖”,“脚”并入“搅”;另一些韵尾则完全失落,和原来的无韵尾韵母合并,如“舌”并入“蛇”,“滑”并入“华”。
《中原音韵》 把声调分为“阴平、阳平、上声、去声”4类,和现代北京话完全相同。中古的平声根据声母的清浊到近古分为阴平和阳平两类:中古清音声母读阴平,如“通、诗、坡、春”;中古浊音声母读阳平,如“同、时、婆、纯”。由于中古浊音声母到近古大部分都已变成清音,因此阴平和阳平就纯粹是声调的区别了。中古和近古虽然都有上声和去声,但内容不尽相同。中古浊音声母中除【m-】、【n-】、【l-】等少数以外,读上声的到近古都变成了去声,如“上”和“赏”、“杜”和“赌”在中古都读上声,但是“上”、“杜”是浊音声母,到近古就读成去声,“赏”、“赌”是清音声母,仍旧读上声。从中古到近古声调最大的变化是入声不再独立成为一类,中古的入声字到近古分别归入阳平、上声和去声,如“达”归入阳平,“笔”归入上声,“麦”归入去声。近古以后,一部分归入上声的入声字又改归阴平,如“说、瞎、督”,《中原音韵》归入上声,现代北京话都读成阴平。至于《中原音韵》时期入声是否已经完全消失,目前仍有不同看法,但入声在当时已丧失独立作为声调的地位,则是可以肯定的。
语音的发展是不平衡的,汉语有一些方言到目前还保留着中古音甚至上古音的一些特点。例如,广州话完整地保存3套塞音韵尾【-p】、【-t】、【-k】和鼻音韵尾【-m】,苏州话系统地保存浊音声母【b-】、【d-】、【g-】、【扷-】、【z-】等。至于入声独立作为声调,不但长江以南大部分方言仍然如此,从黄河下游中原地区直至西北地区也有不少方言仍旧有入声,保存了近古以前汉语声调的一个重要特点。
② 微信历史语音记录为什么播放不了
摘要 这个听不到语音记录我以前也有过类似的情况,主要是后台的清理系统把所占资源较大的语音给清理掉了,所以就留下一个空壳导致听不到消息,毕竟你用微信聊天,不断的产生信息,后台则存储到一定的情况下需要不断的更新(即所谓的删除)一些垃圾的清理,其中包括了一些语音消息的过滤,所以导致你以前的记录语音听不到的原因。
③ 汉语语音的演变
汉语的语音不是一成不变的,大概经历了三个阶段。
从先秦到东汉时期为上古音时期。在我看来,一股脑归入上古音是很不科学的(我觉得华夏族、东夷族、吴蛮荆蛮的语音肯定会互相渗透,语音不变才怪),但这一时期的汉语究竟怎么念,已很难考证。上古音和普通话之间不但声母不同,韵母也可能不同。如果仔细读《诗经》,会发现原本押韵的字不押韵了,不押韵的字押韵了 ——这就是使用普通话阅读的结果。其实明清以前的一些音韵学家也发现了这个问题,但解决问题的方法却有些搞笑——一律叶(读 xie 阳平)韵改读,楞是把不押韵的都按他们的意思改押韵了。当然这是不科学的。
十九世纪末二十世纪初历史比较语言学的发展给上古音研究带来了一丝曙光。我举一个粗鄙的例子来说明:A与B看似没什么关系,但它们有一个共同点C,由是推断A与B有亲缘关系,C先于AB存在,比AB更古老。假设C1是C的原始形态,那么C就是C1的拟构态。
回过头继续说上古音的研究,既然有了历史比较语言学的研究方法,那么也可对其进行拟构(尽管我觉得通过拟构来还原上古音真是玄之又玄)。具体方法是以《诗经》《老子》(注意:都是韵文)的韵部为依据,同时参考较古老的方言(北方方言不在此列)以及日语、朝鲜语中的部分借词(想想我们的祖先多么伟大),找出其相同或相似点进行古音模拟(我总是不能信服)。
汉语语音流变问题(二)
三国魏晋南北朝时期,打打杀杀,甚是热闹,老百姓没过几天安稳日子——8过换成历史书上的官腔就是民族大融合时期(这说法太霸道,汉人想融合,匈奴人想融合,鲜卑人想融合???)。民族一融合,语言就遭殃——一时我说你好你说HELLO,忙死了。于是语音学上就管这一时期为过度时期。
标志这一时期结束而中古音时代开始的是隋代陆法言写的《切韵》——这是中古汉语音韵研究的开山之作。8过我翻了翻这小子的底牌——他居然是鲜卑人!!!“陆”姓是魏孝文帝汉化改革后改的(原姓很搞笑,大家自己去查《魏书》好了,偶就不在这里出他的丑了)。只是不知道这一时期的汉族学者都干什么去了???
这本〈切韵〉比现在的高考参考书牛得多,风靡唐宋两代好几百年——为什么,科举考试要写诗啊!诗要押韵。陆法言把相同韵部的字归在一起,注音并解释,士子们是人手一册(啧啧,现在哪个特级教师有这本事)。唐宋时期的其他韵书,什么〈唐韵〉啊,〈广韵〉啊,〈平水韵〉啊,都以〈切韵〉为蓝本,是换汤不换药的东西。(要是那时人有版权意识就好了,小陆的后代能收几百年的版税啊~~~~~~~~~)
当然我是没陆法言那么好命,他写〈切韵〉也是有机缘的。话说隋朝统一中国后是高举汉文化大旗,可当时的汉语实在是备受摧残,尤其是语音。南北两派语言学家都坚持自己继承了汉语语音的正统(说来可笑,北方经历了五胡乱华,南方与吴蛮百越杂居,还有什么正宗的汉语语音)。一天晚上,南北八大语言学家齐聚陆法言家中,当然不是年轻的小陆请客,而是他老爸陆爽(此陆爽非彼陆爽,不是郑小姐事件中的那个未婚夫)请客。学者喝酒自然与俗人不同,喝着喝着就谈起了语音问题 ——偶滴偶像小陆GG就充当了这次谈话的记录员(换了偶肯定不乐意,凭什么你们吃香的喝辣的却叫我当义务记录员,老爸,劳务费拿来!——所以偶肯定成不了语言学家)
汉语语音流变问题(三)
这场宴席的结果自然是宾客们酒酣而归。若干年后,依稀记得那时老陆已经驾鹤西去(原来让儿子作记录纯粹是自娱自乐,一点也不想造福挣扎在高考战线上的莘莘学子,欠扁)。小陆GG倒是很有雄心壮志去编一本韵书,于是参考了当年的谈话记录,写成了〈切韵〉一书。
其实中古音产生的时间很难说清——决不是某个具体的时间点,〈切韵〉之前的南北朝时期也不是没别的韵书。但〈切韵〉解决了许多语音方面的历史遗留问题,将汉语分为四声(别跟我说阴阳上去,中古音8是这样的)——平、上、去、入。写诗时,平声自然还是平声,上去入归入仄声。
虽然我不能说切韵中所收的字的读音完全等同于当时的民族共同语,但〈切韵〉至少为我们提供了一份研究中古语音的珍贵资料,不会像研究上古音那样困难重重。
现在言归正传,实际上与中古音相似度最高的现存方言是粤方言,现在大家应该有一个感性认识了吧。而唐朝是典型的中古音时期。
所以,〈大明宫词〉里的武攸嗣那一口现代山西方言在那个时代是不可能产生的。所有的正统历史剧都竭力避免让古人讲现代语——可谁真正避免了呢?
汉语语音流变问题(四)
五代后的宋,相信唐风的大多数XDJM都不怎么喜欢,偶也不喜欢。对我而言,宋就像一只肥得流油的羊——无力保护自己,就只有挨啃的份了。语音自身的发展加上异族的入侵(官方说法叫民族融合),汉语语音也随之发生变化。但教育部只对高考参考书作了稍微的修订,士子们考试时押韵的依据还是〈切韵〉(让我想到前几年中国已经搞市场经济了,政治考试时考生们还得说计划经济如何好,典型的计划跟不上形势)。不过,宋朝的教育改革问题并没有前几年“计划”“市场”的问题严重,再加上中国人有祖先崇拜的倾向,也没掀起什么喧然大波。
总的来说,把宋也归入中古音时期是说得过去的——四声还是保持着的。
南宋灭亡后,汉人和汉语都大难临头了,人成了四等公民,还被逼着学蒙古语(北方地区尤其厉害)。这次民族融合(这几个字还真别扭)的结果就是四声发生了严重的变化,简单的说,就是“平分阴阳,入派四声”——北方方言(这可是民族共同语的基础啊)里的入声全部消失(还好,是读音不是文字),伤心啊~~~~~~~
当然,写元曲的再也不能用〈切韵〉了(偶滴偶像小陆GG的畅销书自此退出历史舞台,5555555~~~~~~),取而代之的是〈中原音韵 〉,按凡是学过普通话的人都知道的阴阳上去四声划分。
不怎么愿意接受汉化的元朝最终是从哪里来回哪里去了,但消失的入声已无法恢复。事实上,明朝的标准语音和普通话已经很接近了。值得一提的是,入声在吴方言、粤方言、闽方言里还是保留着的。
清朝入关后。满语对汉语语音的冲击并不大,只不过是增添或改变了个把词汇,没元朝那么大的“划时代意义”。
民国的国语是北京话,共和国的民族共同语是普通话(和北京话还是有一些区别的)。
汉语语音流变问题(尾声)
唠唠叨叨说下来,你可能不敢相信一向引以为豪的汉民族共同语竟是距离原本的汉语最远的,而这的确是事实。
我曾在网上看到有人呼吁学习粤语吴语而被扣以大汉族主义的帽子,这帽子扣得大了点,此公无非是想保护一下中古音罢了。
其实汉族经历了几千年而没灭族的原因无非是包容性的文化和统一的文字。无法想象假如中国像欧洲一样使用拼音文字会变成什么样子。
复兴中古音也好,普通话是胡音也好,都无法改变一个事实,我们仍是中国人,我们依然使用着祖先传给我们的象形文字。如果我们用心,可以读懂先秦的散文、汉赋、六朝骈文、唐诗、宋词、元曲、明清小说——先人传达的是他们的心,而不是这些字的音。
④ 语音识别的发展史
1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。
1960年英国的Denes等人研究成功了第一个计算机语音识别系统。
大规模的语音识别 研究是在进入了70年代以后,在小词汇量、孤立词的识别方面取得了实质性的进展。
进入80年代以后,研究的重点逐渐转向大词汇量、非特定人连续语音识别。在研究思路上也发生了重大变化,即由传统的基于标准模板匹配的技术思路开始转向基于统计模型 (HMM)的技术思路。此外,再次提出了将神经网络技术引入语音识别问题的技术思路。
进入90年代以后,在语音识别的系统框架方面并没有什么重大突破。但是,在语音识别技术的应用及产品化方面出现了很大的进展。
DARPA(Defense Advanced Research Projects Agency)是在70年代由美国国防部远景研究计划局资助的一项10年计划,其旨在支持语言理解系统的研究开发工作。
到了80年代,美国国防部远景研究计划局又资助了一项为期10年的DARPA战略计划,其中包括噪声下的语音识别和会话(口语)识别系统,识别任务设定为“(1000单词)连续语音数据库管理”。
到了90年代,这一DARPA计划仍在持续进行中。其研究重点已转向识别装置中的自然语言处理部分,识别任务设定为“航空旅行信息检索”。
日本也在1981年的第五代计算机计划中提出了有关语音识别输入-输出自然语言的宏伟目标,虽然没能实现预期目标,但是有关语音识别技术的研究有了大幅度的加强和进展。
1987年起,日本又拟出新的国家项目---高级人机口语接口和自动电话翻译系统。 中国的语音识别研究起始于1958年,由中国科学院声学所利用电子管电路识别10个元音。直至1973年才由中国科学院声学所开始计算机语音识别。由于当时条件的限制,中国的语音识别研究工作一直处于缓慢发展的阶段。
进入80年代以后,随着计算机应用技术在中国逐渐普及和应用以及数字信号技术的进一步发展,国内许多单位具备了研究语音技术的基本条件。与此同时,国际上语音识别技术在经过了多年的沉寂之后重又成为研究的热点,发展迅速。就在这种形式下,国内许多单位纷纷投入到这项研究工作中去。
1986年3月中国高科技发展计划(863计划)启动,语音识别作为智能计算机系统研究的一个重要组成部分而被专门列为研究课题。在863计划的支持下,中国开始了有组织的语音识别技术的研究,并决定了每隔两年召开一次语音识别的专题会议。从此中国的语音识别技术进入了一个前所未有的发展阶段。 这一时期的语音识别方法基本上是采用传统的模式识别策略。其中以苏联的Velichko和Zagoruyko、日本的迫江和千叶,以及当时在美国的板仓等人的研究工作最具有代表性。
· 苏联的研究为模式识别应用于语音识别这一领域奠定了基础;
· 日本的研究则展示了如何利用动态规划技术在待识语音模式与标准语音模式之间进行非线性时间匹配的方法;
·板仓的研究提出了如何将线性预测分析技术(LPC)加以扩展,使之用于语音信号的特征抽取的方法。 目前在大词汇语音识别方面处于领先地位的IBM语音研究小组,就是在70年代开始了它的大词汇语音识别研究工作的。AT&T的贝尔研究所也开始了一系列有关非特定人语音识别的实验。这一研究历经10年,其成果是确立了如何制作用于非特定人语音识别的标准模板的方法。
这一时期所取得的重大进展有:
⑴隐式马尔科夫模型(HMM)技术的成熟和不断完善成为语音识别的主流方法。
⑵以知识为基础的语音识别的研究日益受到重视。在进行连续语音识别的时候,除了识别声学信息外,更多地利用各种语言知识,诸如构词、句法、语义、对话背景方面等的知识来帮助进一步对语音作出识别和理解。同时在语音识别研究领域,还产生了基于统计概率的语言模型。
⑶人工神经网络在语音识别中的应用研究的兴起。在这些研究中,大部分采用基于反向传播算法(BP算法)的多层感知网络。人工神经网络具有区分复杂的分类边界的能力,显然它十分有助于模式划分。特别是在电话语音识别方面,由于其有着广泛的应用前景,成了当前语音识别应用的一个热点。
另外,面向个人用途的连续语音听写机技术也日趋完善。这方面,最具代表性的是IBM的ViaVoice和Dragon公司的Dragon Dictate系统。这些系统具有说话人自适应能力,新用户不需要对全部词汇进行训练,便可在使用中不断提高识别率。
中国的语音识别技术的发展 :⑴在北京有中科院声学所、自动化所、清华大学、北方交通大学等科研机构和高等院校。另外,还有哈尔滨工业大学、中国科技大学、四川大学等也纷纷行动起来。
⑵现在,国内有不少语音识别系统已研制成功。这些系统的性能各具特色。
· 在孤立字大词汇量语音识别方面,最具代表性的要数92年清华大学电子工程系与中国电子器件公司合作研制成功的THED-919特定人语音识别与理解实时系统。
· 在连续语音识别方面,91年12月四川大学计算机中心在微机上实现了一个主题受限的特定人连续英语——汉语语音翻译演示系统。
·在非特定人语音识别方面,有清华大学计算机科学与技术系在87年研制的声控电话查号系统并投入实际使用。
⑤ 手机微信历史语音聊天记录怎么查询
1、首先重新下载一个微信,安装完成以后先不用进行内容恢复,先登上微信你会发现漂流瓶、
聊天记录等等都没有
2、在手机端启动微信,然后在微信的主界面底部导航中点击“微信”,所有的聊天记录都
会在此模块下,这里面包含了你和好友的聊天记录.
3、登陆微信账号后点击“设置”,然后选择“退出登陆”,这样做的主要目的是为了生成
微信的系统文件:
4、对备份的文件进行root,删除新生成的乱码文件,然后把原来的文件复制到这个文件夹,
如果你没有删除的话就一定要把它完全覆盖.
5、用usb将手机和电脑连接起来,打开sdcardtencentmicromsg
文件夹,删除新生成的
备份文件,然后把之前备份的旧聊天记录文档复制进去,没有删除的话一定要完全覆盖:
6、打开对应的备份文件夹,如果是正常的话你会看到一堆数字和字母组成文件名的文件夹
,进去以后找到“voice”文件夹,这时你会在文件里看到arm格式文档,
而它就是你所要恢复的微信语音聊天记录:
7、到这里整个恢复操作已经完成,重新登录微信就可以发现以前的聊天记录都回来了
⑥ 语言学纲要论述语音是怎样的演变
语音的变化有很强的规律性.这种演变的规律性有几个明显的特点.第一,变化有一定条件的限制,比方 两组腭化为 组的条件就是齐、撮二呼的前面;浊音清化的条件限于口音,不涉及鼻音和边音,更与元音无关;其中浊塞音和浊塞擦音清化时还按声调的平仄而有送气与不送气的区别.凡符合条件的一律都变,没有例外,如果出现例外,那也可以找出产生这种例外的原因.比方宁波话,古代的k在相当于上述齐、撮二呼的条件下和北京话一样也腭化而成 所以在语音系统中应该不再有像ki 等这样的音位组合.这些音为什么没有在同样的条件下如同"基"那样也腭化成 呢?这就涉及到语音演变规律的第二个特点;时间性.语音演变规律起作用有一定的限制,它只在某一段时期中起作用,过了这一时期,即使处于同样的条件下也不会遵循原来的规律发生语音变化.现代宁波方言的ki等的音位组合时在腭化规律起作用的时期以后产生的语音现象,所以不受这一规律的支配.语音演变规律的第三个特点是地区性.前面讲过,语言的演变是像波浪一样从一个中心向外扩散的,而且扩散有地域的限制,所以音变只在一定的地域中进行.浊音清化的规律在北方话系统中是普遍起作用的,而在吴语地区和湘语区则仍保留原来的浊音,并没有发生清化的现象.语音演变的规律性及其所具有的特点,为我们研究语音发展的历史提供了广泛的基础。
⑦ 语音识别技术的发展历史
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。
但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原理,研究的领域局限在特定人,小词汇表的孤立词识别,实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。
随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。
实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。
这一时期,语音识别研究进一步走向深入,其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力,他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识,从而使统计方法成为了语音识别技术的主流。
统计方法将研究者的视线从微观转向宏观,不再刻意追求语音特征的细化,而是更多地从整体平均(统计)的角度来建立最佳的语音识别系统。在声学模型方面,以Markov链为基础的语音序列建模方法HMM(隐式Markov链)比较有效地解决了语音信号短时稳定、长时时变的特性,并且能根据一些基本建模单元构造成连续语音的句子模型,达到了比较高的建模精度和建模灵活性。在语言层面上,通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。另外,人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。
20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。
其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice'98。它带有一个32,000词的基本词汇表,可以扩展到65,000词,还包括办公常用词条,具有“纠错机制”,其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。 我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。
⑧ 怎么做才可以恢复已经被删除的微信语音历史
曾经用过的方法,试试吧
按照以下操作查看 。
1. 将手机连接到电脑。
2. 打开手机存储卡,找到 tencent/MicroMsg 文件夹。
3. 里面有一个或者多个由一长串数字和字母组成的文件夹,与该手机登录过的微信账号一一对应。
4. 打开这些文件夹,image是缓存和保存的图片。
5. voice是语音,video是小视频。
⑨ 如何找回微信历史语音聊天信息记录,不懂怎么找
方法/步骤
1、用手机的USB线将手机和电脑连接
2、连接好以后打开桌面上的“我的电脑”
3、打开电脑以后会看到多了两个移动磁盘,一个是手机内存,一个是你手机的内存卡
4、一般微信在安装的时候默认都会安装的手机的内存里,打开你手机内存的磁盘
5、打开以后找到“tencent”这个文件夹,打开这个文件夹
6、打开以后再点击“MicroMsg”,打开这个文件夹
7、打开以后看到文件夹名字很长的就是微信聊天记录存放的文件夹,每登陆一个微信就会产生一个名字很长的文件夹
8、打开其中一个文件夹名字很长的文件,找到“voice2”这个文件夹并打开
9、打开以后会看到一些文件夹,这些文件夹的多少取决于你发语音的多少,语音发的多这里的文件夹就多,这些每一个文件夹里面都有一个语音聊天记录
10、将每一个文件夹一直打开以后都会看到一个语音文件,直接双击文件就可以播放,或者将语音文件复制到电脑里进行保存
注意事项
最好在电脑里安装暴风影音进行播放语音文件
⑩ 怎么看待语音的历史以及叶音说
“叶音说”是在没有确凿根据的情况下,强改字音以求押韵和谐,并非探明了韵字的本音。其根本错误,就在于对古韵采取一种形而上学的观点,而非历史的观点,不懂得语音是发展变化的。其后果,则是一个字可叶出许多的音,造成汉字读音的极大混乱。所以说“叶音说”是错误的。