抖音为什么做古籍数字化

对古籍进行修复、数字化,让这些优质内容在当代重获新生,既是企业应尽的社会责任,也能通过这些根植于中国历史和传统文化的「元内容」,带来更丰富的内容生态。

抖音为什么做古籍数字化

作者|范佳恒

抖音正在做一件事情,联合北京大学、国家图书馆等机构,对经典古籍进行修复、数字化和活化。

10 月 11 日,北京大学和字节跳动研发的古籍数字化平台「识典古籍」测试版上线,免费向公众开放。这是一个涵盖了 390 部经典古籍的平台,这些古籍主要来自《四部丛刊》,共计 3000 多万字。

「识典古籍」项目的负责人表示,未来三年,还将陆续完成一万种古籍的智能化整理,基本涵盖儒释道的核心典籍,全部免费开放。

在此之前,去年 6 月,字节跳动还联合国家图书馆、中国文物保护基金会等机构,合作开展古籍修复、数字化和活化,包括捐资 1000 万元,联合成立古籍保护专项基金等,定向修复百余册件珍贵古籍。

修复和数字化这两个概念很容易理解,「活化」简单说,不是在完成修复和数字化后束之高阁,而是通过一系列方法,让大家用起来,成为每个人触手可及和可使用的内容。

为什么字节跳动要花这么多精力和资源,做古籍修复和数字化?

抖音为什么做古籍数字化

首先是企业社会责任的要求。

企业社会责任(Corporate social responsibility,简称 CSR),以及 ESG(Environment, Social and Governance),这两个概念最近几年越来越受到重视,相关的部门或者团队,已经成为大型企业的标配。

对企业来说,做 CSR 不仅是为了做些形象宣传,而是本身应尽的责任。作为社会发展的受益者,除了提供就业、缴纳税收等,企业也有责任对社会和环境有所贡献。这也符合中国传统的认知,个人或企业发展起来后,回馈社会,社会和公众也因此更愿意支持企业。

抖音集团副总裁李涛介绍,在 2020 年,字节跳动就针对履行企业社会责任的方向,面向各个相关主体做了广泛的调研,最终形成了四个方向:推动数字包容;丰富文化生活;增进社会福祉;应对气候变化。同时,也形成了字节公益的 Slogan:「激发创造,丰富生活」,与整个字节的 Slogan 一致。

「识典古籍」项目,属于丰富文化生活方向的重点项目,从 2020 年就在酝酿,并且陆续和国家图书馆、中国文物保护基金会、北京大学等展开一系列合作。

为什么选择这个项目?对企业来说,可选的 CSR 项目有很多,但是一个比较可持续的原则是,选择能够充分发挥企业能力,同时又是社会急需的,而且其它企业又不是特别感兴趣的项目。这样既可以让企业有能力在同一方向持续投入,从整体 CSR 的角度来看,不同企业又能根据自身禀赋,形成分工,促进整个社会福祉的增加。

而在古籍修复、数字化、活化这件事情上,抖音的优势让它有机会能做到最好。

早在 2007 年,我国就推出了「中华古籍保护计划」,无论在古籍的整理、修复、数字化等方面,都已经做了许多工作。

今年 4 月,国家发布了《关于推进新时代古籍工作的意见》,指出要完善古籍工作体系、提升古籍工作质量,并通过「挖掘古籍的时代价值」「促进古籍的有效利用」「推进古籍数字化」「做好古籍普及传播」等方式加快古籍资源的转化利用。

古籍保护和有效利用,越来越受重视,但客观来看,仍然面临人力、资金、技术等各种困难。

根据统计,国内现在大约有 5000 万册件古籍,其中亟待修复的有 1000 万册件,20 万种古籍中,只有 8 万种完成影像数字化扫描,截至 2019 年,有 3.8 万种完成文本数字化。如果要将现存的古籍全部修复整理出来,大概需要 300 年时间,所以亟需引入新的技术、方式和参与者。

抖音为什么做古籍数字化

「识典古籍」带来了更高的效率。在古籍的修复和数字化方面,除了资助修复人才的培养之外,「识典古籍」项目将通过文字识别、自动标点、命名实体识别等技术,提高 OCR 识别的效率和准确度,目前已经可以把准确率从行业平均 93%-94% 的水平提高到 96%-97%。

实际上,现在已经有一批各具特点的古籍数字化平台,但这些平台往往主要面向专业研究人员或者爱好者,普通公众访问不便,而且用户体验不流畅。

相对来说,「识典古籍」有抖音的产品和交互能力作为基础,页面简洁,浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,后续还将上线手机版。

除了修复和数字化,以及在平台搭建上,抖音具备先进的技术和产品能力,在古籍活化方面,抖音更有优势。抖音庞大的用户数,活跃的 UGC 和 PGC 内容生态,以及在短视频、图文等方面的传播能力,非常适合让古籍重新焕发生命力。

很多人潜意识里会认为古籍晦涩难懂,这是事实。但是在数字化手段下,可以让原本离普通人有距离的古籍,走进人们的生活,变得鲜活起来。

在这之前,针对古籍,抖音已经提供了不少延展内容。例如由西瓜视频、鲜时光 TV 联合出品的九集纪录片《穿越时空的古籍》,每集 15 分钟,内容鲜活有趣, 除了古籍修复外,还将古代的美食、服饰等复原出来,让古籍在现代生活活过来。

抖音为什么做古籍数字化

国家图书馆副馆长、国家古籍保护中心副主任张志清表示,通过这个活动,不仅发现了很多修复师,和其它方面的守护人,而且发现还有更多人都在参加古籍守护工作,让专家们感到非常震撼。

「识典古籍」项目负责人介绍,未来还希望通过古籍数字化,提供更多延展内容和趣味的玩法,以视频、互动、游戏等形式,让古籍触及到更多人。包括跟 PICO 合作,把古籍的一些原生场景,通过 VR 方式复现出来。

第三,古籍包含的海量「元内容」,对抖音的内容生态将产生强大的推动作用。

内容平台天然对优质内容有更强烈的渴求,无论中外,概莫如是。内容越丰富多元,就越能吸引用户,也更容易自然生长出更多业务。

相对普通用户创作的内容,经过几千年累积下来的古籍,包含海量经过千锤百炼的「元内容」。这些根植于中国历史和传统中的「元内容」,不仅本身自带对用户的生命力和吸引力,而且经得起反复的再次创作,对于内容生态的丰富性和爆发性至关重要。

类似例子不胜枚举。比如说,围绕一部《红楼梦》,过去 200 多年,诞生了多少经典内容?围绕这些经典内容,又衍生出了多少二次创作的内容?

以抖音账号「红楼宴」为例,通过复刻《红楼梦》中的各式菜品,目前在抖音获得了 52 万粉丝。「红楼宴」主理人郝振江介绍,他们从《红楼梦》中多大 186 处的美食记录中,整理出各种大菜、小吃、点心、饮品等,在尊重原著的同时保持创新。

他们在抖音发布的相关内容,受到来自天南海北用户的喜欢。而通过这些内容,《红楼梦》在普通用户心中变得比以前更加鲜活起来,也激发了他们对传统文化的喜爱。

「识典古籍」项目负责人介绍,未来三年,将陆续完成一万种古籍的智能化整理,基本涵盖儒释道的核心典籍,这些内容全部免费开放给公众。未来还将邀请专家学者,提供有深度的知识讲解和古籍知识科普。

识典古籍未来还将和字节旗下的百科产品「识典百科」,以及抖音、头条等产品打通,假如用户在抖音或者头条上搜索某一个古籍中提及的词语,就会出来相应主题的介绍,并且可以链接到更具体的内容去阅读,或者相关的视频内容。

可以想象,随着这些原本深藏阁中的古籍,完成数字化,并且通过一系列内容再创作被介绍给公众,不仅这些优秀的内容可以重新活过来,对用户形成新的滋养,并且成为新的创作源头,带来更繁荣活跃的内容生态。

声明:本站部分文章或资源,整理于网络或由网友提供,主要用于知识性分享与学习用途。若相关内容侵犯了原著者的合法权益,请联系处理。
站长

500 万人遁入「佛门」,年轻人正在沉迷在手机敲木鱼

2022-11-2 8:57:26

新鲜事站长

机器人视觉怎么实现连接器的自动装配?视觉工作原理

2023-2-10 17:28:20

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧