-
类型丰富
资源类型涉及图书篇章、内容插图、音视频、档案等,涉及分类包括中图法分类、学科分类等具有多级分类结构的分类标引,资源在清洗入库后经过出版自动标引自动分类资源。2022-12-14
-
自动优化
只需要预先设定分类类别和数据训练集就能够实现,编辑审核后的标引数据再次用于下一轮机器学习,该过程由程序自动执行,不断优化输出结果,形成良性闭环,帮助准确程度及工作效率持续升级。2022-12-14
-
准确率高
自动分类标引质量目标达到准确率在98%以上,测试数据集准确率在95%以上。在一般生产环境下可以做到较高的准确率。2022-12-14
-
通过RESTFUL
通过RESTFUL接口和SDK进行数据的采集2022-12-14
-
基于NOSQL
基于NOSQL数据库CASSANDRA进行数据的分布式存储2022-12-14
-
基于APACHE SPARK
基于APACHE SPARK 进行数据的分布式计算2022-12-14
-
基于ECHARTS
基于ECHARTS 进行丰富的图表展示2022-12-14
-
基于内容关联
基于内容关联(CONTENT-BASED)和协同过滤算法(COLLABORATIVE FILTERING)实现用户画像2022-12-14
-
高保真
高保真原版原式展现所有像素,保持和Word2019的高达99%的兼容性2022-12-14
-
可回写
以HTML展现时,可以对HTML进行修改并写回原文档2022-12-14