当前位置: 首页 > news >正文

huggingface 模型权重文件

文件类型文件名示例用途
模型权重 pytorch_model.bin 或 model.safetensors 包含模型训练后的参数权重
配置文件 config.json 包含模型架构和超参数配置
词汇表文件 vocab.jsonvocab.txttokenizer.json 分词器所需的词汇映射
分词器配置 tokenizer_config.json 分词器的配置参数
特殊标记文件 special_tokens_map.json 定义特殊标记(如[CLS], [SEP]等)

 

PyTorch 格式

model/
├── pytorch_model.bin      # 模型权重
├── config.json            # 模型配置
├── tokenizer.json         # 分词器
├── tokenizer_config.json  # 分词器配置
└── vocab.txt              # 词汇表

TensorFlow 格式

model/
├── model.ckpt.index       # 模型权重索引
├── model.ckpt.data-00000-of-00001  # 模型权重数据
├── config.json            # 模型配置
└── vocab.txt              # 词汇表

SafeTensors 格式(推荐)

model/
├── model.safetensors      # 安全的模型权重格式
├── config.json            # 模型配置
└── tokenizer.json         # 分词器

 

http://www.wxhsa.cn/company.asp?id=7665

相关文章:

  • vscode设置单击选中带连字符的单词
  • P4147 玉蟾宫(悬线法)
  • 全局平衡二叉树
  • Transactional注解的方法里 spring怎么知道我用的是哪个jdbctemplate实例
  • 根据参数查询
  • 关于非侵入式脑机接口面向C端一个应用想法
  • Blelloch并行扫描算法
  • 国产化DevOps生态崛起:Gitee如何赋能企业数字化转型
  • 【IEEE出版】2025年电气、控制与人工智能国际学术会议(ICOECAI 2025)
  • 采购计划 vs 物料需求计划(MRP),采购新手最容易搞混的两份“清单”!
  • P10299 [CCC 2024 S5] Chocolate Bar Partition
  • 实用指南:企业实施数字化转型时常见的挑战
  • 当ARMxy+AI边缘计算落地水泵行业就碰撞出怎样的火花?
  • QN8035 FM芯片驱动开发
  • 再见 Claude Code,我选择了 Codex!真香!!
  • 2025中国DevOps工具生态全景:本土化突围与智能化跃迁
  • 字符串转 python 对象 eval
  • 蛋白多序列比对美化
  • Gitee推出Remote mcp-gitee:云端MCP服务开启智能协作新时代
  • Gitee DevOps平台:驱动中国企业数字化转型的核心引擎
  • 10 类多布局扫描图像数据集:支撑 OCR 精度提升与 VLM 微调,覆盖广告 / 简历 / 论文等场景的计算机视觉训练数据
  • 国产化Excel开发组件Spire.XLS教程:C# 轻松将 DataSet 导出到 Excel
  • Mysql:Docker的Mysql容器加载Levenshtein 距离算法脚本,实现“相似度匹配”
  • 树链剖分
  • 【2025-09-17】慢慢得到
  • Excel处理控件Aspose.Cells教程:如何使用Python在Excel中创建下拉列表
  • STM32的电子钟功能实现
  • kylin V11安装mysql8.0.41(glibc2.28)
  • __cpuid
  • Gitee崛起:国产代码托管平台如何重塑企业研发效能新格局