传统出版数字化的关键与产业方向
编辑:佚名 来源:中国出版网 更新于:2018-3-6 阅读:
“经典古籍数据库”。中华书局经过3年的开发,已上线古籍1200多种、10亿字。2017年实现升级改造:第一,建立“传统文化大数据中心”,未来3年实现5万种古籍、150亿字的数据化。第二,依托大数据中心,开发古籍、善本、工具书、论著4个数据库。第三,依托大数据中心,一是以众筹分包的形式向大众组稿,二是对古籍整理进行自动标点、注释、校勘、翻译,三是采取数字平台+按需印刷的方式进行出版。
语言文字知识服务平台。商务印书馆以300种工具书和500多种语言文字图书,为中小学生提供了学习平台。它以字词所涵盖的丰富内容,通过可读、可视、可听的方式,构建生动形象、触类旁通、激发思考的知识学习体系:一是纸本到线上的产品服务,目前已上线《新华字典》APP;二是数据库服务,可针对不同需求开发不同数据库;三是多语种学习;四是与华为、腾讯、百度、搜狗、科大讯飞合作,提供权威的语言文字基础数据。预计在5年内实现个人付费用户达到60万人/年、累计150万人次,机构用户累计达到1400家,APP累计销售157.5万份,数据包产品用户最高达到500万人/年。
中读。汇集杂志、自媒体、书籍等内容数据,通过大数据的深度解析,提取内容兴趣、知识点、阅读习惯、阅读互动行为等标签,对用户的知识需求进行精准画像,为用户提供更精准的内容。同时,通过互联网化的手段,不断聚集内容、用户及需求,形成内容生产传播大数据生态。
在线音乐教育平台。以音乐大数据为基础,采取“开发区招商模式”,吸引国内外音乐培训机构入驻,以众包众筹方式,提供各种音乐学习产品和服务。同时,通过语音识别技术,导入名师资源,提供测试、问诊及解决方案,规划未来几年吸引5万名商家入驻,积累2000万用户。
易阅通平台。一是实现数据资源的海量聚合。目前已上线外文电子书36万种、数字期刊1.35万种,中文电子书39万种、数字期刊3700多种,有声书10.5万集,开放获取资源5.4万种。二是实现对图书馆由纸本提供向数据内容提供商转变。三是易阅通打通了国内外4万多家图书馆和100多万个人用户的渠道,并在100多个国家开通了72小时直供的按需印刷网点。
译见跨语言大数据。一是构建起了全球最大规模的语言资源大数据,其中双语平行语料累计超过48亿句对,仅次于谷歌,中英平行语料规模全球最大;二是构建了全球最大规模的多语文本大数据,采集数据源超过2000万个,日更新超过3000万篇新闻和5亿条社交媒体数据,数据总量达到2PB,其中新闻数据量超过200亿篇,覆盖60多种语言和100多个国家;三是领先的跨语言搜索技术和基于知识图谱的语义搜索技术,构建起了新闻、企业和科技等领域知识图谱。
上篇:
下篇: