默认冷灰
24号文字
方正启体

第一千三百七十八章 思维体系 (1 / 3)

作者:二子从周 最后更新:2025/7/22 0:05:45
        “本来是这样的。”周至乐得眼睛都眯缝了:“可是两位师兄提供的字卡太好用了。”

        “《字海》的字卡,有编号,有大字,有拼音、民国拼音、甚至还有老四角号码,还有小字的释义和凡例,满足了我们自动识别软件对于调试校准模型的一切要求,我们当然也要用到那头去!”

        周至又道:“有了字卡的辅助,我们很快便将软件识别图形文字的准确率,从百分之九十二,也就是一百个字错八个,提升到了百分之九十九点六,也就是依靠软件识别文字,一千个字里只会读错四个。直接提升了一個量级。”

        “这个成就,也直接帮我们跨过了数字图书馆最后一个巨大门槛,这个软件,已经算是真正成熟了。”

        “这次带来的数字化的《字海》,就是我们第一本通过计算机扫描识别技术建立起来数字图书,既然字数最多的《字海》都可以实现数字化,那对其余典籍,我们当然充满了信心!”

        “那就是古籍数字化工作可以提上日程了?”韦一心大喜:“我们学校正在搞《四库全书丛目》这部大书,要不肘子你来我们学校?学籍什么的好说……”

        一边计算机中心主任也连连点头:“其实清华那边没去头,肘子你到底是文科生,来我们这儿正好搞古籍数字化工程,想想看,这个大工程搞出来,那会是多大成就?古人说的君子三立,立德立功立言,不都在里边了?”

        周至听得心中暗笑,应该说北大的文化氛围的确可以的,你看计算机中心主任都说得出君子三立这样的命题解读来……

        不过这事儿暂时没有可能,周至只好笑着解释:“我们蜀大的《道藏》,《儒藏》两部大书也准备开修了,师爷爷是不可能放人的。”

        “不过现在有了好工具,哪怕我不来北大,大家也能够加快工程的进度。现在还是说回正事儿,我利用数字化的《字海》,演示一下我们对数字典籍整理的工程架构协议及标准。”

        这个东西是周至的自创,哪怕上一世,这也是图书典籍工程里没有过的东西。

        直到周至穿越回来之前,国家将典籍进行数字化的工作,主要还停留在建立树状数据库的较为原始的应用阶段。

        就好比一个标准的图书馆,将一本书作为一个文本文件整体存放,然后给这个文件编出,书名,书号,最多再给出个作者,出版社之类的信息,作为标签。

        内容未完,下一页继续阅读
(←快捷键) <<上一章 举报纠错 回目录 回封面 下一章>> (快捷键→)

大家都在看?