Stars
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
CodeGeeX: An Open Multilingual Code Generation Model (KDD 2023)
🦜🔗 The platform for reliable agents.
A high performance caching library for Java
SGPT: GPT Sentence Embeddings for Semantic Search
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似度计算模型,开箱即用。
中文langchain项目|小必应,Q.Talk,强聊,QiangTalk
Robust Speech Recognition via Large-Scale Weak Supervision
The official gpt4free repository | various collection of powerful language models | o4, o3 and deepseek r1, gpt-4.1, gemini 2.5
这是一款提高ChatGPT的数据安全能力和效率的插件。并且免费共享大量创新功能,如:自动刷新、保持活跃、数据安全、取消审计、克隆对话、言无不尽、净化页面、展示大屏、拦截跟踪、日新月异、明察秋毫等。让我们的AI体验无比安全、顺畅、丝滑、高效、简洁。
ChatGPT 中文调教指南。各种场景使用指南。学习怎么让它听你的话。
计算机基础(计算机网络/操作系统/数据库/Git...)面试问题全面总结,包含详细的follow-up question以及答案;全部采用【问题+追问+答案】的形式,即拿即用,直击互联网大厂面试;可用于模拟面试、面试前复习、短期内快速备战面试...
【Java面试+Java后端技术学习指南】:一份通向理想互联网公司的面试指南,包括 Java,技术面试必备基础知识、Leetcode、计算机操作系统、计算机网络、系统设计、分布式、数据库(MySQL、Redis)、Java 项目实战等
📄 适合中文的简历模板收集(LaTeX,HTML/JS and so on)由 @hoochanlon 维护
High-level library to help with training and evaluating neural networks in PyTorch flexibly and transparently.
Bioinformatics'2020: BioBERT: a pre-trained biomedical language representation model for biomedical text mining
[EMNLP 2021] SimCSE: Simple Contrastive Learning of Sentence Embeddings https://arxiv.org/abs/2104.08821
Just use pyecharts to imitate Echarts official example.
GeoLite2-City.mmdb.gz CDN files based on Free Open Source CDN jsDelivr!
Nature Methods: RNA foundation model (together with RhoFold)
Transformer-based protein function Annotation with joint feature-Label Embedding
Foldseek enables fast and sensitive comparisons of large structure sets.