-
ICT-中国科学院计算技术研究所
- Beijing
- https://blog.csdn.net/u010366748/
Stars
Easy-to-use and powerful LLM and SLM library with awesome model zoo.
CNN-RNN中文文本分类,基于TensorFlow
关于机器学习,深度学习,自然语言处理等各种算法的实现、示例,与博客文章配套,论文复现等
Implementation of triplet loss in TensorFlow
超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题
深度学习500问,以问答形式对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,以帮助自己及有需要的读者。 全书分为18个章节,50余万字。由于水平有限,书中不妥之处恳请广大读者批评指正。 未完待续............ 如有意合作,联系[email protected] 版权所有,违权必究 Tan 2018.06
State-of-the-Art Text Embeddings
BertViz: Visualize Attention in NLP Models (BERT, GPT2, BART, etc.)
大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
Java封装的网络测试工具集,集成了nslookup、ping、curl、traceroot等多个小工具,可用于追溯访问一个URL的整个网络过程,访问网站URL使用扩展WebDriver Selenium以及基于W3C标准的Resource Timing API和Navigation Timing API
Code for the paper "Language Models are Unsupervised Multitask Learners"
Deep Learning Book Chinese Translation
此项目是机器学习(Machine Learning)、深度学习(Deep Learning)、NLP面试中常考到的知识点和代码实现,也是作为一个算法工程师必会的理论基础知识。
中文预训练XLNet模型: Pre-Trained Chinese XLNet_Large
Simple XLNet implementation with Pytorch Wrapper
XLNet: Generalized Autoregressive Pretraining for Language Understanding
The source code of NeurIPS 2020 paper "CogLTX: Applying BERT to Long Texts"
使用EDA技术对小型的不均衡的数据集做增强,验证其效果提升