2018年10月21日 Sunday

您的当前位置: 首页 > 语文工作 > 理论研究

理论研究

锡伯族语言文化有声数据库建设概述

时间:2015年8月24日文章来源:办公室点击数:2014 字体:

一、项目建设背景

锡伯族语言文化有声数据库建设,系2013年由国家语委立项,江苏省语委提供资助和技术支持、由自治区民语委承担的项目,现已由自治区民语委委托给伊犁犁师范学院锡伯语言文字研究中心进行建设。该项目根据《国家中长期语言文字事业改革和发展规划纲要(2012~2020年)》中提出的“科学保护各民族语言文字,营造和谐语言生活”的要求,针对在信息化浪潮和社会强势语言文化的冲击下锡伯族语言文化的使用范围不断缩小、使用人群不断减少、使用功能不断弱化的实际,以及其生存环境不断恶化等现况,依据中国语言资源有声数据库建设领导小组制定的《中国语言资源有声数据库调查手册·汉语方言》,依据锡伯族语言文化亟需保护和传承的现实需求进行建设。通过该项目建设,可为锡伯族语言文字与传统文化的抢救、保护和传承做出积极贡献,同时也为我国和世界满—通古斯语族语言文化的研究提供具有“活化石”价值的语言文化资料。

二、项目建设指导思想

尊重锡伯语的规律,保护好、传承好我国锡伯语的语言资源和文化遗产,弘扬锡伯族优秀文化,并为世界和我国满通古斯诸语族语言文化的保存、研究提供活态语言资源。结合锡伯语的现状,利用信息化手段,依照统一规范,采集当代锡伯语的有声资料,全面科学地描写、展示锡伯语的面貌,并进行科学的整理加工和长期保存。

三、项目建设工作思路

该项目建设在教育部、国家语委的关心和指导下,在江苏语委的大力支持下,在自治区民语委的精心组织和策划下,充分发挥政府、专家和社会各方面的作用,科学规划、稳步实施、积极探索、有序推进,严格按照技术规范和工作规范扎实开展工作,努力把锡伯语的有声数据库建设成精品工程,使之成为锡伯族地区语言保护和文化建设的重要工程。

四、项目建设目标

该项目以锡伯语口语为建设对象,采用记录锡伯语语音、词汇、语法、话语等方法,建立包含锡伯语口语的语音系统、词汇系统、语法系统、句法系统和会话系统的有声数据库;重点搜集并建立有代表性说唱文化作品的有声数据库,从而达到可供研究、展示和长久保存的目标。

五、项目建设内容

该项目的建设内容主要有四项: 一是以锡伯语口语为对象,通过录音录像,记录有代表性的锡伯语口语语音、单词、词汇、语法句子和会话,建立锡伯语口语有声数据库和说唱文化资源数据库;二是在ELAN数据库软件上建立锡伯语口语有声数据库档案(音频为主)和说唱文化精典作品资源数据库档案(视频为主);三是研发锡伯族语言文化有声数据库管理系统,实现锡伯语录音、锡伯文输入、编辑、排版、存储、数据交换和数据管理等功能;四是编写出版《锡伯族语言文化有声数据库调查规范手册》。

六、项目技术实现方式

锡伯族语言文化有声数据库建设以数字化技术为支撑,对锡伯语口语的现状和精典文化进行调研,采集现阶段锡伯语口语和说唱文化的第一手有声资料,全面科学地描写和展示锡伯语口语和说唱文化的现实面貌,以数字化手段对所录入的有声数据进行整理加工,建立锡伯族语言文化有声数据库管理系统,达到长期存储和使用的目标。项目建设充分借鉴江苏语委建立汉语方言有声数据库的工作经验和技术实现方法,充分发挥政府主管部门、高等院校和专家的作用,严格按照技术规范和工作规范,采用录音、录像手段,采集和记录在日常生活中使用的锡伯语口语和说唱文化资源,力求比较全面地反映现阶段锡伯族社会生活中的锡伯语口语和说唱文化的实态。

七、田野调查

做好田野调查是做好锡伯语有声数据库的重要前提,该项目以锡伯语重点使用地区察布查尔锡伯自治县为调查对象,在调查了解当地人文地理环境的同时,通过实地调查,搜集家庭生活生活中的锡伯语、工作语言中的锡伯语、社交活动中的锡伯语,不同年龄、性别、职业人员的锡伯语,小学至初中锡伯文教学中的锡伯语、服务行业的锡伯语以及民间故事、民歌、萨满歌、戏曲、念说等精典文化作品中的锡伯语口语资料。

八、录音录像和数据库建档

录音录像:通过调查和搜集,精选锡伯语口语和说唱文化资料,制定锡伯语口语语音、词汇、句子、会话和唱歌、讲故事、念说和阅读文章等的录音方案。制定发音人和演唱人的选择条件和录音录像要求,现已按规定条件选择了10多名锡伯语口语标准语音发音人和多名精典说唱文化作品的演唱人,已在专业录音室和录像室完成录音和录像工作。

锡伯语口语建档:一是在ELAN数据库软件上建立以音频为主要格式的锡伯语口语资源库档案,建立其一级、二级、三级目录。三级资源目录排列内容:名称、语音库 (音系、单句、词汇、语法句子、会话)、音频(分钟)、参考数据量(GB);二是所有语料全部通过ELAN处理、存储、显示;三是建立本地专家、口语发音人、资料翻译者的个人档案;四是填写调查表,对所有调查的对象,均填写调查表;五是在ELAN数据库软件上对锡伯语口语的语音系统、单词、词汇、语法句子和会话进行罗马字母转写、国际音标转写及锡汉/汉锡双向对译的词性标注、语法标注、会话标注;六是在同一文档上依次标注、显示和存储:汉文、锡伯文(在研发第三大模块即数据库管理系统时解决锡伯文的导入、导出及标注、显示和存储问题)以及罗马字母、国际音标转写等。

锡伯族说唱文化精典作品建档:一是在ELAN数据库上建立以视频为主要格式的锡伯族说唱文化作品的一级、二级、三级目录。三级资源目录排列内容:名称、语言、文本(千字)、录制(出版)单位、音频(分钟)、视频(分钟)、图片(张)、参考数据量(GB)。本项可与锡伯语口语录音语料库目录合并共建总目录;二是按民歌、萨满歌、婚礼歌和习俗歌、朱伦呼兰比和更心比、汗都春艺术平调和越调系列、民间故事、创作歌曲、文艺演出节目及相关文化作品分别建档。

九、锡伯语有声数据库管理系统的研发

该系统研发的主要目标是建立锡伯语、汉语有声数据库。研发的主要任务有:一是研发编写竖排的锡伯文输入、输出和编辑处理控件;二是研发编写拼音输入、输出和编辑处理控件;一是研发编写锡伯文转写标音输入、输出和编辑处理控件;四是研发编写播放、录制管理模块;五是研发编写锡伯语有声数据库录入和库管理系统。数据库管理系统主要实现的功能是:单机环境下的锡伯文、汉文、锡伯文转写、拼音平衡数据库录入和管理系统,本系统包含系统管理、数据管理、统计、数据库维护、数据导入导出和帮助等主要功能模块等。

十、项目进展情况

截止现在,该项目已完成锡伯语口语语音、单词、词汇、语法句子、话语的录音,共录制了锡伯语口语阿字首和11字首共约1500多个音节的语音、2000多个词汇、500多个句子、600余条会话的录音,同时录制了大约1TB锡伯族精典文化作品,对所有发音人和演唱人均作了录音和录像并建立了个人档案,凡所录制的录音和演唱材料基本能够反映锡伯族语言文化的现实状态。目前,该项目正在ELAN数据库软件上建立锡伯语口语有声数据库档案(音频为主)和说唱文化资源数据库档案(视频为主),锡伯族语言文化有声数据库管理系统正在研发当中,《锡伯族语言文化有声数据库调查规范手册》也正在编写之中。整个项目拟在2015年底完成。

十一、结语

锡伯族语言文化有声数据库建设,是自治区成立60年以来所实施的一项有关锡伯族语言文化建设方面的重要工程,该项目的建设得到了党和政府部门的高度重视,得到了江苏省等援疆单位的大力支持。可以相信,通过该项目建设,可对面临生存危机的锡伯族语言文化的保护和传统注入强大活力,可为子孙后代留下一笔珍贵的文化遗产,可促进锡伯族语言文化面向现代化发展,可为锡伯族地区经济社会发展做出积极贡献。