三战微调大模型

微调方法汇总 全量微调(Full Fine-tuning):这是最直接的微调方法。即在下游任务的训练数据上,对预训练模型的所有参数进行训练和更新。全量微调可以让模型充分适应新的任务,但需要更新的参数量巨大,对算力要求很高,而且有可能导致过拟合、遗忘预训练知识等问题。 提示微调(Prompt-tuni

Lee 发布于 2024-12-28

命名实体识别的评估指标

在命名实体识别(NER)任务中,常用的评估指标包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)和 F1 值(F1-Score)。这些指标用于衡量模型在识别实体时的性能。以下是这些指标的详细解释及其意义: 1. 准确率(Accuracy) 定义:准确率是所有预测正确

Lee 发布于 2024-06-25

微调大模型

如何增强模型能力 微调是其中的一个方法,当然还有其他方式,比如外挂知识库或者通过 Agent 调用其他 API 数据源,下面我详细介绍下这几种方式的区别。 微调是一种让预先训练好的模型适应特定任务或数据集的方案,成本相对较低,这种情况下,模型会学习训练者提供的微调数据,并且具备一定的理解能力。

Lee 发布于 2024-06-17

Topic Modelling tutorial

对于数据的敏感,来自对数据的统计,今天我们将基于LDA模型找一篇中文报道找出它的主题,并进行词云绘制 LDA(Latent Dirichlet Allocation) 在 LDA 中,建模过程围绕三件事展开:文本语料库、文档集合、D 和文档中的单词 W。因此,该算法试图通过以下方式从该语料库中发现

Lee 发布于 2024-03-22

kaggel:宇宙飞船泰坦尼克号(随机决策树)

kaggle Kaggle是一个在线数据科学竞赛平台,它聚集了来自世界各地的数据科学家和机器学习爱好者。Kaggle提供各种数据集,用户可以使用这些数据集来练习数据分析和机器学习技能,并通过参与竞赛来解决问题。这些竞赛通常由公司、研究机构或其他组织发起,涉及各种实际问题,如预测房价、识别图片中的物体

Lee 发布于 2024-03-14

读懂Transformer

1.Transformer 整体结构 首先介绍 Transformer 的整体结构,下图是 Transformer 用于中英文翻译的整体结构: Transformer 的整体结构,左图Encoder和右图Decoder 可以看到 Transformer 由 Encoder 和 Decoder 两

Lee 发布于 2024-03-07

深度学习处理文本分类

配置文件 Config = { "model_path": "output", 'ret_data_path': "output/ret_data.csv", "train_data_path": "test_data.csv", "valid_data_path":

Lee 发布于 2024-03-01

day21 回溯法

什么是回溯法 回溯法也可以叫做回溯搜索法,它是一种搜索的方式。 回溯是递归的副产品,只要有递归就会有回溯。 所以以下讲解中,回溯函数也就是递归函数,指的都是一个函数。 回溯法的效率 回溯法的性能如何呢,这里要和大家说清楚了,虽然回溯法很难,很不好理解,但是回溯法并不是什么高效的算法。<

Lee 发布于 2024-02-21