V
主页
如何训练一个粤语BERT基本模型?by 指南【FoLiSC-2】
发布人
2022-7-24【FoLiSC-2】會議錄影第一場 指南:Introduction to Train a Cantonese BERT Base Model ABSTRACT This article uses HKCancor, Mozilla Common Voice, Cantonese Wikipedia, and Cantonese corpora collected from the Internet to train a Cantonese base BERT model based on transfer learning from a Traditional Chinese language model trained by ckiplab/BERT-base-Chinese. BERT was a language model introduced by Google in 2018[1], trained by a large corpus. Using BERT as a base model in downstream NLP tasks can significantly shorten the training time, and achieve good results. This article briefly introduced the process of training the BERT model, including data parsing, data processing, and finding what the breakthrough the Cantonese BERT model can bring to the Cantonese NLP downstream NLP task. *嶺南粵音第二屆嶺南語言討論會(The 2nd Forum on Languages in South China,FoLiSC-2)由嶺南粵音·泛粵典編委會主辦。
打开封面
下载高清视频
观看高清视频
视频下载器
广东中部粤方言的次浊上字分调现象——by otto【FoLiSC-4】
南宁沙街萧云举后人用白话介绍萧云举故事片段(2)
就是一组平平无奇的明母字「各地粤方言明母字读法(2)」
各地粤语帮母字读法(6)
南宁沙街萧老白话讲解和展示萧云举最新版图片
睇睇泛粤典有乜嘢内容同功能
粤语的古知母字读t的有什么地方?「各地粤语知母字读法(2)」
看看粤方言有多少是帮母读内爆音?「各地粤语帮(非)母字(4)」
最新工具:机器同传直播、影片Speech Translator
【字越声汉】原神4.8活动(四)
【泛粤地图】(十)今次读下1991年余蔼芹的分片法(上)
《吞食天地三国演义》(41)攻略西川
南宁沙街萧老介绍萧云举埋葬地
各地粤语彻母字读法(1)
论四邑方言的次浊上声二分 ——by 陳泂龑Kwingiem Chan 【FoLISC-3】
各地粤方言並母字读法(3)「广州城区南宁城区龙门左潭顺德大良东莞万江深圳福田崇左江州茂名茂南湛江赤坎」
各地粤语滂母字读法(2)
【文本棒读】广州话挑战一分钟内读完全入声文《郭沫若的故事》
【字越声汉】原神4.8活动(六)
看看粤方言有多少是帮母读内爆音?「各地粤语帮(非)母字(5)」
南宁沙街萧老介绍南宁各萧氏宗族来源
粤语的古知母字读t的有什么地方?「各地粤语知母字读法(1)」
說普通話,方便你 我 他?各地人稱代詞「你我他」讀音
各地粤语各种读法的澄母字(2)(重製版)
打得粤语输入:TypeDuck输入法
说普通话,文明「你们 我们 他们」
【越南vtb】模仿粤语 展示普通话 仁香リンラン
看看粤方言有多少是帮母读内爆音?「各地粤方言帮母字读法(8)」
【搬运】Little Girl:學泰文 泰文好簡單 廣東話泰文
你们家的精母字是塞音还是塞擦音「各地粤方言精母字读法(1)」
粤方言‶帮端母读内爆音出自侗台语底层‶说再探讨——以桂东南勾漏片方言有音无字词和送气分调为切入点——by 暾明 【FoLISC-3】
本次是平平无奇的一组滂母字「各地粤方言滂母字读法(3)」
《吞食天地三国演义》(17)过五关斩六将
【北部湾vup】北部湾人做桂北(柳州话)考试
【粤西vup(误)】粤西粤语深情演唱
【字越声汉】崩铁2.4练武活动(五)
广东中部方言的词汇接触演变类型 ——by otto 【FoLISC-3】
【泛粤地图】(三)快来听讲解人一人说几十种粤语方言,地图嘅字如何选取(讲解人鸠ngap1按照小学堂同一直以来嘅经验读各地地名)
南宁沙街萧老白话介绍南宁萧氏先祖第一代
各地粤方言生母字读法(2)