Skip to content

将jieba.NET换成AOTba,以支持GB18030-2022、AOT编译等,同时修复漏洞#12

Open
4Darmygeometry wants to merge 16 commits into
CosineG:masterfrom
4Darmygeometry:master
Open

将jieba.NET换成AOTba,以支持GB18030-2022、AOT编译等,同时修复漏洞#12
4Darmygeometry wants to merge 16 commits into
CosineG:masterfrom
4Darmygeometry:master

Conversation

@4Darmygeometry
Copy link
Copy Markdown

原版jieba.NET依赖反射不支持AOT编译,且依赖的Newtonsoft.Json版本存在漏洞。本PR将jieba.NET换成AOTba 1.0.9,有如下特点:
支持lcut与lcutforsearch直接返回列表
支持日期/时间完整提取不被拆开(如下午3点半、晚上8点30分、2021-01-01 09:00:00)
支持比例提取(如提取“金龙鱼1:1:1调和油”的“1:1:1”)
支持提取域名(如https://gitee.com/JTsamsde/AOTba
支持完整提取带下划线/短线单词(如TF-IDF)
支持版本号提取(如v1.0.1、1.0.1、3.2-preview1、4.1.2-rc1、2.1-alpha1、6.3-beta2)
支持异步加载词典
支持含Emoji句子断句
支持带变体选择符和ZWJ的复杂emoji断句(甚至支持到Unicode 16的emoji)
全面支持GB18030-2022及一号文要求(基本区到扩展I区汉字处理能力)
可AOT编译
可以使得OPENCCNET支持GB18030-2022及一号文范围内的繁简中文转换,且表情包及扩展区汉字不会拆成代理对,域名等完整

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant