InternLM2论文笔记 这里是阅读InternLM2论文的笔记 微调方式 在大模型的下游应用中,可以有两种微调方式 增量续训 即无监督的方式,让模型学习一些新知识,比如某些垂直领域的新知识 使用的数据有:书籍,文章,代码等1. 有监督微调 为了让模型学会理解指令进行对话,或者注入少量的领域知识 使用的数据为高质量的对话和问答的数据 全量参数微调 部分参数微调 (lora等) 扩展上下文长度 必要性: 1. 检索增强生成 2024-11-23
Anaconda下的pytorch环境配置及pycharm导入(win10+CPU) Anaconda下的pytorch环境配置及pycharm导入(win10+CPU)Anaconda下的pytorch环境配置及pycharm导入(win10+CPU)首先下载Anaconda与pycharm两个软件,可移步至各教程。注意pycharm专业版的需要破解,否则无法远程连接服务器调试。 1.创建Pytorch环境。我们首先使用anaconda来创建一个Pytorchd的工作环境。打开A 2024-11-23
【已解决】如何在服务器中下载huggingface模型,解决huggingface无法连接 问题说明在服务器上使用huggingface模型时,如果直接指定模型名称,用AutoTokenizer.from_pretrained(“model_name”),可能会由于网络原因会报错 Failed to connect to huggingface.co port 443 after 75018 ms: Operation time out 因此我们需要下载模型到服务器上,得到模型本地的路径 2024-11-23
【已解决】conda install报错 An HTTP error occurred when trying to retrieve this URL. 更换清华源也无效 常用指令 1234567#查看源conda config --show channels#添加源conda config --add channels [源地址]#删除源conda config --remove channels [源地址] 添加清华源 1234conda config --add channels http://mirrors.tuna.tsinghua.edu.cn/ana 2024-11-23
【疑难杂症】pandas将dataframe导出为csv文件,用excel打开出现乱码字符/有多余列/行数不对 问题描述使用pandas导出csv文件后用excel打开,出现乱码,列数也增加了。 但是在pandas中读取csv文件,dataframe中显示正常 问题原因将DataFrame导出为CSV文件时,如果没有指定正确的编码,那么在Excel中打开文件时可能会出现乱码。默认情况下,pandas.DataFrame.to_csv函数使用utf-8编码,但是Excel通常使用utf-8-sig或cp12 2024-11-23
【疑难杂症】overleaf公式显示异常并且被重复添加至正文内,正文内$符号消失,编译报错Missing $ inserted.inserted text。 【疑难杂症】overleaf公式显示异常并且被重复添加至正文内,正文内$符号消失,编译报错Missing $ inserted.inserted text。问题描述此问题困扰本人许久,搜索了许多相关情况都没有我这样的。每次编译后,overleaf中的公式会编译错误,并且被莫名其妙地添加到正文中,而且原来引用公式的dollar符号$$也异常消失。 问题举例原始文本: 编译后文本: 正文中的内容被 2024-11-23
【疑难杂症】conda虚拟环境里使用which python 与虚拟环境名称对应不上的问题 1. 问题描述conda activate启动虚拟环境后,在命令行输入which python,显示的python编译器并不是虚拟环境目录里的python编译器,如下所示 123(vllm-env) xxx@ubuntu46:~/project/eval_model$ which python/home/xxx/anaconda3/envs/open-instruct-env/bin/python 2024-11-23
Minhash算法直观理解 作者: @凌漪_ @板烧鱼仔 @Yuxn. 背景 Jaccard相似度 两个集合 A 和 B,我们关心它们的Jaccard相似度$$ J(A,B)=\frac{∣A∪B∣}{∣A∩B∣} $$ Jaccard相似度描述了两个集合之间的相似程度。 使用场景1:两个文档之间的相似度。注意: jaccard相似度并没有提取文档的任何语义,只是在查看它们是否包含相同的单词。因此, 2024-11-23 #文本去重 #Minhash
【傻瓜教程】jsp连接MySQL数据库,及连接过程中出现空指针的坑。[附java与Mysql驱动程序下载] 【傻瓜教程】jsp连接MySQL数据库,及连接过程中出现空指针的坑。[附java与Mysql驱动程序下载]课程作业中的网站要实现后台,需要进行数据库连接。记录连接过程及掉进去的坑。 在Eclips中新建一个动态网站,输入项目名称。 File - New - Dynamic Web Project 1. 右击项目,新建一个jsp文件 1. 通过Workbench来新建数据库。首先打开wor 2024-11-23
【超简易安装】在linux集群服务器上使用conda安装高版本cuda(cuda-11.8)和pytorch2.0 【超简易安装】在linux集群服务器上使用conda安装高版本cuda(cuda-11.8)和pytorch2.0目录0. 背景分析我使用的是lunix多人集群服务器。集群服务器需要用作业调度系统,也就是bsub命令之后才能提交作业,运行任务。在这种多人服务器下,如果想要查看原本的cuda版本,在命令行中直接输入nvidia-smi是无效的,会报错nvidia-smi:command not fo 2024-11-23