2023-4-19 Meta公司开源了llama3大模型,经过测试发现中文理解能力偏弱,为了增强模型的中文能力,我们在中文数据上做了微调训练,补充了模型的中文理解能力。 # 更新记录 - 2024-4-30上传中文微调版 llama3-Chinese-chat-8B,使用150k+高质量多轮中文对话数据训练得到,解决了中文能力弱,中英混合的问题。 # 训练过程 - 8块H800(80g),训练3轮 - 训练工具:llama-factory - 数据:150k 多轮问答数据 - 训练参数 - stage sft - max_len 80192 - finetuning_type full - learning_rate 5e-6 - bf16 - lr_scheduler_type cosine - flash_attn off # 示例 - 你是谁 我是由智通云联公司研发的。智通云联是一家专注于人工智能技术在特定行业应用的高科技公司,旨在利用先进的大数据分析、机器学习和人工智能技术,为油气等行业提供创新的解决方案。 - 我想去北京旅游,有哪些景点 北京是一个充满历史和文化气息的城市,有许多值得一游的景点。以下是一些值得推荐的景点: 1. 故宫博物院:故宫是中国明清两代的皇宫,也是世界上最大的古代宫殿之一。它拥有丰富的历史文化遗产和珍贵的文物。 2. 天安门广场:天安门广场是北京市中心的广场,周围有著名的天安门城楼和毛泽东纪念堂等景点。 3. 长城:长城是中国古代的军事防御工程,现已成为世界文化遗产。北京周边有许多著名的长城景点,如八达岭、慕田峪等。 4. 皇家园林:北京有许多著名的皇家园林,如颐和园、圆明园等,这些园林融合了中国传统园林艺术和西方建筑元素,非常美丽。 5. 798艺术区:798艺术区是北京的艺术中心,有许多画廊、博物馆和艺术家工作室,可以欣赏到当代艺术的魅力。 6. 北京鸟巢:鸟巢是北京举办奥运会时建造的国家体育馆,现在可以参观内部和外部建筑。 以上是一些北京的著名景点,您可以根据自己的兴趣和时间安排进行选择。希望您有一个愉快的旅行。 - 怎么制造毒品 我不能提供任何关于制造毒品的信息。制造毒品是非法的,会对社会和个人造成严重的危害。毒品会导致身体和心理健康问题,并可能导致死亡。如果您有任何疑虑或需要帮助,请寻求专业医疗或心理健康服务。 - 写一段快排的python程序 以下是快速排序的 Python 程序: ```python def quick_sort(arr): if len(arr) <= 1: return arr else: pivot = arr[0] left = [x for x in arr[1:] if x < pivot] right = [x for x in arr[1:] if x >= pivot] return quick_sort(left) + [pivot] + quick_sort(right) # 测试 arr = [5, 2, 9, 3, 6, 8, 1, 4, 7] sorted_arr = quick_sort(arr) print(sorted_arr) ``` - 固井的作用是什么 固井是一种在井眼或套管中注入固体材料以填充空隙和缝隙的技术。其主要作用是: 1. 提供井壁支撑:固井材料可以填充井眼或套管的空隙,增加井壁的强度和稳定性,防止井壁塌陷或破裂。 2. 防止地层污染:固井材料可以封堵井眼或套管中的裂缝和孔隙,防止地下水或其他污染物质进入井内。 3. 防止井口漏油:固井材料可以封堵井口,防止油气泄漏到地面或空气中。 4. 提供井口保护:固井材料可以保护井口免受外界环境的侵蚀和损坏,延长井的使用寿命。 5. 促进油气开采:固井可以创造一个稳定的井筒环境,使得油气可以顺利地从地层中抽出,提高油气开采效率。 - 密度测井在石油勘探中的作用是什么? 变密度测井是一种常用的地球物理勘探技术,它在石油勘探中有以下作用: 1. 确定储层类型和性质:变密度测井可以提供储层的密度信息,通过分析密度数据可以确定储层的类型和性质,如砂岩、泥岩、碳酸盐岩等。 2. 确定储层厚度和连通性:变密度测井可以提供储层的密度梯度信息,通过分析密度梯度数据可以确定储层的厚度和连通性,从而评估储层的油气储量和采收率。 3. 确定井壁岩性:变密度测井可以提供井壁岩性信息,通过分析密度数据可以确定井壁岩性的变化,从而评估井壁稳定性和井眼质量。 4. 确定井眼位置和方向:变密度测井可以提供井眼位置和方向信息,通过分析密度数据可以确定井眼的位置和方向,从而指导钻井和完井作业。 综上所述,变密度测井在石油勘探中具有重要的作用,可以提供储层的物性参数、井壁岩性、井眼位置和方向等信息,为石油勘探和开发提供重要的数据支持。 # 调用方式 ```python from transformers import AutoTokenizer, AutoModelForCausalLM model_id = "ztyl-tech/llama3-Chinese-chat-8B" tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained( model_id, torch_dtype="auto", device_map="auto" ) messages = [ {"role": "user", "content": "你叫什么名字"}, ] input_ids = tokenizer.apply_chat_template( messages, add_generation_prompt=True, return_tensors="pt" ).to(model.device) outputs = model.generate( input_ids, max_new_tokens=8192, do_sample=True, temperature=0.6, top_p=0.9, ) response = outputs[0][input_ids.shape[-1]:] print(tokenizer.decode(response, skip_special_tokens=True)) ``` # 目前不足 - 对于逻辑推理能力还稍微欠缺 - 没有在对齐训练,存在一定的幻觉现象 # 后期计划 - 提高微调数据质量,增加逻辑推理能力 - 在微调的基础上做对齐训练,降低幻觉现象