图书名语料库(Book-Names-Corpus) 业余项目“萌名(一个基于语料库技术的取名工具)”的副产品。不定期更新。只删词,不加词。 可用于中文分词、作品名识别。 图书名语料库(Book-Names-Corpus) 100万。清洗后仍存有大量badcase,主要是电影名、电视名、游戏名等。 请勿提交涉政issue: 惹不起呀,谢谢~ 语料中还存有的,会在后续的更新中逐步删除掉。 @萌名 整理 2019.05.14