Skip to content

Bond-H/Book-Names-Corpus

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 

Repository files navigation

图书名语料库(Book-Names-Corpus)

业余项目“萌名(一个基于语料库技术的取名工具)”的副产品。不定期更新。只删词,不加词。
可用于中文分词、作品名识别。

图书名语料库(Book-Names-Corpus)
100万。清洗后仍存有大量badcase,主要是电影名、电视名、游戏名等。


请勿提交涉政issue:

惹不起呀,谢谢~
语料中还存有的,会在后续的更新中逐步删除掉。


@萌名 整理

2019.05.14

About

图书名语料库。含部分电影、游戏名称。

Resources

License

Stars

Watchers

Forks

Packages

No packages published