相关文章
llama-factory 系列教程 (五),SFT 微调后的模型,结合langchain进行推理
背景
微调了一个 glm4-9B的大模型。微调后得到Lora权重,部署成vllm 的API,然后通过langchain接入完成相关任务的推理。
关于SFT 微调模型的部分就不做介绍了,大家可以参考前面的文章,将自己的数据集 在 Llamafactory 的 dataset…
建站知识
2024/12/9 16:33:51
《最终幻想14》手游版已获准在中国发行
上个月,有传言称史克威尔和腾讯正在合作开发前者大获成功的MMORPG《最终幻想14》的手机版。Niko Partners分析师丹尼尔艾哈迈德在推特上提到,中国国家新闻出版署已批准发行新一批进口游戏,其中包括《最终幻想14》的手机版,名为《最…
建站知识
2024/12/20 15:07:30
C++ STL copy, move 用法
一:功能 正向(从前向后的顺序)拷贝/移动操作,将一个容器元素拷贝/移动到另一容器中。
二:用法
#include <iostream>
#include <vector>
#include <algorithm>int main() {std::vector<std::str…
建站知识
2024/12/25 9:39:23
推荐系统三十六式学习笔记:工程篇.常见模型28|让你的推荐系统反应更快:实时推荐
目录 为什么要实时实时推荐1.架构概览2.实时数据3.流计算4.计算实时化5.效率提升 总结 推荐系统从业者所追求的三个要素:捕捉兴趣要更快,指标要更高,系统要更健壮。 我们今天就要说的就是这个“更快”。推荐系统是为了在用户和物品之间建立连…
建站知识
2024/12/13 1:52:51
软件测试---Jmeter
一、简介 二、安装与启动
(1)安装 安装包:通过百度网盘分享的文件:jmeter环境.rar 链接:https://pan.baidu.com/s/1OB0IP3W7hqUjAGj_5F56sQ
建站知识
2024/12/25 9:39:37
【算法】递归实现二分查找(优化)以及非递归实现二分查找
递归实现二分查找
思路分析
1.首先确定该数组中间的下标 mid (left right) / 2;
2.然后让需要查找的数 findVal 和 arr[mid] 比较
findVal > arr[mid],说明要查找的数在 arr[mid] 右边,需要向右递归findVal < arr[mid],说明要查…
建站知识
2024/12/9 14:20:51
vite instanceof 失效
背景:给一个巨石单体项目进行标准化模块拆分,封装出来的模块代码用 vite 进行构建,但模块启动后页面上的表现一直和 webpack 那版不一致
一步步 debug 后,发现问题出在下面这个判断条件
const GeneratorFunction function* () …
建站知识
2024/12/12 10:20:42