北京奥数网
北京站

2022年大事记

奥数北京站 > 专题 > 教育新闻 > 正文

清华大学可识别多体蒙古文

2007-05-24 11:06:02 下载试卷 标签:大学 少数民族 函数 启蒙教育 特长测试

  近日,由清华大学承担的多体蒙古文(混排汉英)印刷文档识别暨统一平台少数民族文字识别系统通过了教育部科技发展中心组织的鉴定。

  在教育部、国家语委、国家自然科学基金委的支持下,清华大学与内蒙古大学、内蒙古师范大学协作研究开发成功了多体蒙古文(混排汉英)印刷文档识别系统,并结合清华大学已研制成功的的藏维文等文档识别研究成果,在世界上首次推出了统一平台上蒙古文、藏文、维吾尔文、哈萨克文、柯尔克孜文及朝鲜文(混排汉英)印刷文档识别系统。在多体蒙古文(混排汉英)印刷文档识别系统研究方面,根据蒙古文的实际特点和难点,采用基于字素的文本切分识别方案。

  主要技术特点如下:

  1.提出了一种基于统计鉴别分析的多字体多字号蒙古文字符识别的方法,对蒙古文的常见多种字体(白体、黑体、报体、哈旺体/楷体等二十余种字体)具有良好适应性,单字测试平均识别率达99%以上;

  2.提出并实现多字体蒙古文文本切分方法,在提取单词基线位置后,通过定义代价函数,综合分析字符几何位置、形状等多种信息,取代价函数极小值处作为切分点;提出了蒙汉英语种判别方法,结合汉、英文识别技术,实现蒙汉英混排文本识别。文本识别率可达96.8 %以上。

  3.具有蒙古文印刷文档版面分析方法,可分析处理文本、图片、表格区域。

  4. 研制字符形码到Unicode标准蒙古文编码转换方法。

关注奥数网官方微信 数学资料、数学真题、更有全国教育资讯
微信搜索“奥数网”或扫描二维码即可添加

来源:教育部科技发展中心

  

  • 欢迎扫描二维码
    关注奥数网微信
    ID:aoshu_2003

  • 欢迎扫描二维码
    关注中考网微信
    ID:zhongkao_com

最近发生的事

学校推荐

攻略推荐

北大附中

北大附中初中部共有18个教学班,学生700人左右,教...

点击查看

教育导航

  1. 北京站 上海站 广州站 深圳站
  2. 天津站 武汉站 成都站 石家庄站
  3. 南京站 杭州站 济南站 苏州站
  4. 郑州站 沈阳站 太原站 重庆站
  5. 长沙站 合肥站 宁波站 青岛站
本地教育

本地教育资讯 | 推优指导 | 择校攻略

面试技巧 | 经验交流 | 分班考试

特长生 | 小学统测 | 最新试题

热门资料

本地教育信息 | 真题

面试题 | 模拟题

重点中学

北京人大附中 | 北京北大附中

北京十一学校 | 北京二中分校

北京第四中学 | 北京第八中学

小学试题

期中试题 | 口算题

期末试题 | 数学知识点

单元测试 | 练习题

京ICP备09042963号-15 京公网安备 11010802020155号

违法和不良信息举报电话: 010-56762110 举报邮箱:wzjubao@tal.com

奥数网版权所有Copyright@2005-2021 www.aoshu.com. All Rights Reserved.