句子嵌入: 交叉编码和重排序
|
|
0
|
687
|
2024 年2 月 6 日
|
全世界 LoRA 训练脚本,联合起来!
|
|
0
|
1228
|
2024 年2 月 5 日
|
随机 Transformer
|
|
0
|
521
|
2024 年1 月 29 日
|
最新 Hugging Face 强化学习课程(中文版)来啦!
|
|
0
|
704
|
2024 年1 月 22 日
|
SetFitABSA: 基于 SetFit 的少样本、方面级情感分析
|
|
0
|
383
|
2024 年1 月 18 日
|
给科研人的 ML 开源发布工具包
|
|
0
|
448
|
2024 年1 月 17 日
|
开放 LLM 排行榜: 深入研究 DROP
|
|
0
|
416
|
2024 年1 月 15 日
|
Hugging Face CEO: 2024 将是AI丰收年
|
|
0
|
282
|
2024 年1 月 12 日
|
使用推测解码 (Speculative Decoding) 使 Whisper 实现 2 倍的推理加速
|
|
0
|
391
|
2024 年1 月 10 日
|
非工程师指南: 训练 LLaMA 2 聊天机器人
|
|
0
|
632
|
2024 年1 月 6 日
|
Huggy Lingo: 利用机器学习改进 Hugging Face Hub 上的语言元数据
|
|
0
|
352
|
2024 年1 月 4 日
|
欢迎 Mixtral - 当前 Hugging Face 上最先进的 MoE 模型
|
|
0
|
734
|
2024 年1 月 4 日
|
Hugging Face 年度回顾:2023,开源大模型之年
|
|
0
|
462
|
2023 年12 月 29 日
|
Reformer 模型 - 突破语言建模的极限
|
|
0
|
586
|
2023 年12 月 27 日
|
混合专家模型 (MoE) 详解
|
|
0
|
1188
|
2023 年12 月 26 日
|
3D 高斯点染简介
|
|
0
|
571
|
2023 年12 月 26 日
|
Google Colab 环境现已无需手动登录 HF 账号
|
|
0
|
998
|
2023 年12 月 22 日
|
在灾难推文分析场景上比较用 LoRA 微调 Roberta、Llama 2 和 Mistral 的过程及表现
|
|
0
|
818
|
2023 年12 月 19 日
|
3D 高斯喷溅 🤗 为什么图形永远不会相同
|
|
0
|
468
|
2023 年12 月 16 日
|
使用 PyTorch FSDP 微调 Llama 2 70B
|
|
0
|
1051
|
2023 年12 月 11 日
|
使用 PyTorch 完全分片数据并行技术加速大模型训练
|
|
0
|
816
|
2023 年12 月 4 日
|
Google Colab 现已支持直接使用 🤗 transformers 库
|
|
0
|
745
|
2023 年12 月 1 日
|
Gradio-Lite: 完全在浏览器里运行的无服务器 Gradio
|
|
0
|
572
|
2023 年12 月 1 日
|
【AI 安全探索】AI 流行的时代,我们应该担心什么?
|
|
0
|
297
|
2023 年11 月 28 日
|
深入理解 BigBird 的块稀疏注意力
|
|
0
|
592
|
2023 年11 月 23 日
|
使用 LCM LoRA 4 步完成 SDXL 推理
|
|
0
|
795
|
2023 年11 月 23 日
|
使用 PPO 算法进行 RLHF 的 N 步实现细节
|
|
0
|
1034
|
2023 年11 月 16 日
|
个人编程助手: 训练你自己的编码助手
|
|
0
|
689
|
2023 年11 月 14 日
|
Transformers 中原生支持的量化方案概述
|
|
0
|
1099
|
2023 年11 月 13 日
|
Hugging Face 在法国联合启动人工智能创业项目!
|
|
0
|
286
|
2023 年11 月 10 日
|