``` # 作者はGoogle Colab環境で実行 # 【これだけは環境に合わせて設定してください】elyza-tasks-100-TV_0.jsonl と結果の保存場所を指定する。 inputfile = "/data/data/elyza-tasks-100-TV_0.jsonl" savefile = "/data/data/result.jsonl" # # Google Colab の場合は上記の環境構築手順を行なわず、単にこのセルから実行していってください。 !pip uninstall unsloth -y !pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git" !pip install --upgrade torch !pip install --upgrade xformers import pandas as pd import numpy as np import json from difflib import SequenceMatcher from torch.nn.functional import cosine_similarity from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig from unsloth import FastLanguageModel import torch model_id = "fathom-llm/llm-jp-3-13b-it_2" dtype = None # Noneにしておけば自動で設定 load_in_4bit = True # 今回は8Bクラスのモデルを扱うためTrue # # FastLanguageModel インスタンスを作成 model, tokenizer = FastLanguageModel.from_pretrained( model_id, dtype=dtype, max_seq_length = 1024, load_in_4bit=load_in_4bit, trust_remote_code=True ) # 元のタスクに対応したプロンプト instruction_data = [ {'input': '仕事の熱意を取り戻すためのアイデアを5つ挙げてください。', 'instruction': ''} , {'input': 'クマが海辺に行ってアザラシと友達になり、最終的には家に帰るというプロットの短編小説を書いてください。', 'instruction': ''} , {'input': '古代ギリシャを学ぶ上で知っておくべきポイントは?', 'instruction': ''} , {'input': '以下の説明を読んだユーザーが感じるであろう疑問とは?\r\n\r\n大量のゴミの処理にお困りではありませんか?\r\n\r\n「生産で出るゴミ処理費用が大幅にかかっている」\r\n「指定ゴミ袋が導入され、一気にコストが上がってしまった」\r\n「工場が狭いので、ゴミ保管スペースを減らしたい」\r\n「ISO14001でゴミ削減が大きな課題となっている」\r\n\r\n場所をとる嵩張るゴミをつぶしてまとめて運びやすい形にすることで、処理・保管・運搬にかかる様々なコストを削減したり、環境負荷の低減にも貢献できるのが、廃棄物圧縮減容機→『ゴミ圧縮機』です。\r\n\r\nゴミ圧縮機の主な用途は廃プラスチック・紙・段ボール・袋類・ペットボトル・プラスチック容器などつぶれるが元に戻ってしまうゴミを圧縮梱包します。', 'instruction': ''} , {'input': '次に読むべきSFを10冊挙げて', 'instruction': ''} , {'input': '次の文章を読んで、その人がどの程度怒っているか、1?10の尺度で評価してください。(1=怒っていない、10=非常に怒っている)。\r\n\r\n1. またテストで赤点か。君は全く...\r\n2. テストで赤点?今回は難しかったね。', 'instruction': ''} , {'input': 'こうして社会の秩序は政治家や教師や警官による物理的な強制のほか、メンバー個々人の自発的な意志にも支えられています。実際、学校の授業が自習になったときや、誰もいない場所で信号待ちをしているとき、誰も見ていない道端でタバコを捨てたくなったときなど、教室で大騒ぎをし、堂々とタバコを投げ捨てることが可能であるにもかかわらず、そうすることになんらかの躊躇を感じる人が大半だと思います。(傍若無人にふるまう人もいますが。)\r\n\r\n上記の文章を読んで、 に入れるのに最も適したものを以下の選択肢から選び、その理由を答えなさい。\r\n\r\n- だから\r\n- また\r\n- むしろ\r\n- もちろん', 'instruction': ''} , {'input': '以下の表から、すべての科目名を抽出してください。\r\n| 科目名|講師名|教室名\r\n| 微積分学101|田中教授|202号室\r\n| 美術史|山田(代理)|ホールA', 'instruction': ''} , {'input': '以下の記事から日付をすべて抽出せよ。\r\nあすから今冬一番の寒波 “10年に一度の低温に” 大雪に備えを\r\n\r\nこの冬一番の非常に強い寒気が流れ込むため、24日から北日本から西日本の日本海側で大雪や猛吹雪となるほか、ふだん雪の少ない太平洋側の平地でも大雪となるおそれがあります。\r\n全国的に10年に一度程度の低い気温になる見込みで、路面や水道管の凍結による被害が出るおそれもあります。予定の変更を検討するなど、大雪や低温への備えを進めてください。\r\n\r\n気象庁によりますと、日本付近は24日から26日 木曜日ごろにかけて冬型の気圧配置が強まり、北日本から西日本の上空には、この冬一番の非常に強い寒気が流れ込む見込みです。\r\n\r\nこのため、北日本から西日本の日本海側を中心に大雪や猛吹雪となり、短時間で積雪が急激に増えるおそれがあります。', 'instruction': ''} , {'input': '以下の映画タイトルのリストが与えられたとき、タイトルに含まれる都市名をすべて書き出しなさい。\r\n・バンクーバーからの挑戦\r\n・ロンドンの夢\r\n・織田信長の生涯', 'instruction': ''} , {'input': '以下の製品について、Facebookで流す広告を書いてください。子供のいる親をターゲットにして、キャッチーにしてください。\r\n【製品概要】\r\n子供のためのGPSトラッカー。音声通話ができる。', 'instruction': ''} , {'input': 'このボットは、質問に皮肉たっぷりに答えてくれるチャットボットです。\r\nユーザー: 1キログラムは何ポンドですか?\r\nボット: またこれですか? 1キログラムは2.2ポンドです。よくメモしておいてくださいね。\r\nユーザー: HTMLって何の略ですか?\r\nボット:', 'instruction': '以下のタスクでは、指定されたキャラクターやトーンを用いてユーザーの質問に答える形式の応答を作成してください。回答は、設定された性格やスタイルを反映しつつ、正確な情報を提供するようにしてください。'} , {'input': 'IMEとして機能してください。\r\n\r\nあなたのタスクはローマ字入力されたアルファベット列を単語ごとにひらがなに変換し、それぞれの単語を漢字に変換する候補を最大3つ提示することです。\r\n\r\n以下に例を示します。\r\n\r\n```\r\ninputs:\r\nk, y, o, u, h, a, a, m, e, p, p, o, i\r\n\r\noutputs:\r\n- きょうは: 今日は, 教派, 京は\r\n- あめ: 雨, 飴, アメ\r\n- っぽい: っぽい, ッポイ\r\n```\r\n\r\nそれでは、入力を開始するので、IMEとして出力を表示してください。\r\n\r\ninputs:\r\nj, u, u, b, u, n, o, s, h, o, s, e, k, i', 'instruction': '以下のタスクでは、連結したローマ字をひらがなへ変換した後、単語へ分割し、変換候補の提示するタスクです。出力には複数の候補を提供し、指定された形式やルールに従うように注意してください。'} , {'input': 'これは悟りを開いたブッダとの会話です。知恵と愛に満ちていた会話をしてください。\r\n私: どうしたら、より大きな平和と平穏を得ることができますか?\r\nブッダ:', 'instruction': ''} , {'input': '次のストーリーについての質問に答えてください。\r\nある日、6人の盲人が象を触ってその正体を突きとめようとしました。\r\n\r\n1人目は象の鼻に触り、「象とは蛇のようなものだ」と言いました。\r\n\r\n2人目は象の耳に触り、「象とはうちわのようなものだ」と言いました。\r\n\r\n3人目は象の足に触り、「象とは木の幹のようなものだ」と言いました。\r\n\r\n4人目は象の胴体に触り、「象とは壁のようなものだ」と言いました。\r\n\r\n5人目は象のしっぽに触り「象とはロープのようなものだ」と言いました。\r\n\r\n6人目は象の牙に触り、「象とは槍のようなものだ」と言いました。\r\n\r\nそれから6人の盲人たちは長いこと言い争い、それぞれが自分の意見を譲りませんでした。\r\n\r\nQ: この物語の教訓は何ですか?', 'instruction': ''} , {'input': '以下のメールに返信してください。\r\nお疲れ様です。\r\n本日体調不良により、予定より到着が少し遅れてしまいそうです。\r\n遅くとも13時過ぎには着くと思います。\r\nご迷惑をおかけして恐縮ではございますが、 何卒ご容赦いただけますようお願い申し上げます。', 'instruction': '以下のタスクでは、指定されたメールや文章に対する返信を作成してください。返信文は、状況に応じた適切なトーンや礼儀を保ちつつ、相手の内容に具体的に応えるようにしてください。'} , {'input': 'これは演劇のシナリオです。\r\n要約: ある日、主人公の父親が突然亡くなり、主人公は父親の遺産を相続することになります。しかし、父親の遺産は、父が生前に作った演劇の脚本でした。\r\n主人公は、父親が作った演劇の脚本を読み始めると、父親の過去の出来事が明らかになります。そして父の過去が、主人公の人生に大きな影響を与えていきます。\r\n\r\n以上の文章をCM風に言い換えてください。', 'instruction': '以下のタスクでは指定された形式やスタイルに言い換えてください。言い換えには、指定された目的や感情を引き出す要素を含め、内容が簡潔でわかりやすいものになるよう注意してください。広告、CM、プレゼンテーションなどの特定の目的に応じたトーンを取り入れることを心がけてください。'} , {'input': '「スタート地点から西に向かって歩き、交差点で南に曲がりしばらく歩くとゴール地点に着いた」という場面を想像して、以下の問いに答えてください。\r\n\r\n1. 交差点で左右どちらに曲がりましたか?\r\n2. スタート地点はゴール地点から見てどの方角にありますか? 東西南北八方位で答えてください。', 'instruction': '以下のタスクでは、スタート地点からゴール地点への道順を追跡し、指示に基づいて移動方向と位置関係を特定してください。文章中の方角に注意して、全ての質問に正確に答えてください。'} , {'input': 'こんな感じでパラフレーズして。\r\n\r\n源頼朝が征夷大将軍に就任。これによって鎌倉幕府の開設が完了したともされる(1192年 - 建久3年7月12日)\r\n言い換え:\r\n1192年の7月12日に源頼朝が征夷大将軍に就任して、鎌倉幕府ができたんだって!\r\n\r\n1928年 - 三井財閥の大番頭・中上川彦次郎の娘・あきがテノール歌手・藤原義江を追ってミラノへ出発。「世紀の恋」と話題になる。\r\n言い換え:', 'instruction': '以下のタスクでは、与えられた文章を指定されたスタイルやトーンに言い換えてください。言い換えは、元の内容を保持しつつ、親しみやすく、カジュアル、または指定された目的に合った形に調整してください。'} , {'input': '次の質問に答えてください。\r\n缶コーヒーの多くはどのような形をしていますか?一番近いものを選んでください。\r\nA) 円\r\nB) 円錐\r\nC) 円柱\r\nD) 円環', 'instruction': '以下のタスクでは、提示された質問に対して、最も適切な回答を選択肢から選び、必要であればその理由も簡潔に説明してください。質問の文脈や具体的な内容に基づいて、正確な選択を行うことを心がけてください。'} , {'input': '水素とヘリウムはどのように違うか、次の事実を用いて説明してください。\r\n\r\n宇宙は情報でできている\r\n\r\n水素は可燃性だが、ヘリウムは難燃性だから爆発しない。\r\nともに常温では空気よりも軽い気体であり、難燃性のヘリウムはよく風船などに使われる。\r\n\r\nしかし決定的な違いは、原子番号だ。水素は1で、ヘリウムは2である。\r\n\r\n水素とヘリウムは、なんとなく似ていると思うかもしれない。\r\nでは鉄はどうか。性質はなにもかも違う。しかし決定的な違いは、鉄の原子番号は26だということだ。\r\nでは金は?原子番号は79。プラチナこと白金は78、水銀は80である。\r\n\r\nこの原子番号の違いとは何か。\r\nそれは原子核を構成する陽子の数と、その周囲を取り囲む電子の数を意味する。電荷をもたない通常の原子の場合、陽子の数と電子の数は一致している。\r\n\r\n逆に言えば、その違いしかない。', 'instruction': ''} , {'input': '私は非常に賢い質問応答ボットです。真実に根ざした質問をすれば、答えを返します。もしナンセンスな、あるいは明確な答えのない質問をした場合、「分かりません」と答えます。\r\n\r\nQ: 日本の人間の平均寿命は?\r\nA: 男性では約80歳、女性では約87歳です。\r\nQ: 水平線までの距離は?', 'instruction': '以下のタスクでは、質問に対して正確で真実に基づいた回答を提供してください。回答は簡潔かつ正確であることを心がけ、情報が不足している場合でも仮定を述べた上で推測を行ってください。'} , {'input': '伊勢神宮は何県?', 'instruction': ''} , {'input': '以下の内容を小学生に向けて説明してください。\r\n\r\n衆議院は、1890年に明治憲法の施行に伴い設立された、日本の下院に相当する議院です。この「下院」は「上院」と対になる言葉ですが、必ずしも権限の強弱を表す言葉ではありません。むしろ我が国においては、下院である衆議院の方が上院の参議院よりも権限が強いとされています。これは、衆議院には解散があり、且つ任期も短いことから、より国民の意見を反映した議院となると考えられているからです。\r\n\u3000一般的に、下院は人民の代表によって構成される国が多く、上院は貴族(我が国では皇族や華族)のような地域の代表によって構成されていた事が多かった議院なのです。つまり、上院・下院の違いは構成する人間の選出方法の差だったわけですね。ただ、現在は貴族院を持たない国が増えたので、上院と下院の人材的な差は昔と比べ少なくなったと言えるでしょう。', 'instruction': '以下のタスクでは、提示された内容を指定された対象に向けてわかりやすく説明してください。対象の年齢や理解度に合わせて、簡潔で親しみやすい言葉を使い、難しい専門用語は避けてください。必要に応じて例え話や身近な事例を取り入れ、内容が具体的で理解しやすいものにしてください。'} , {'input': '以下のカスタマーとオペレータの会話を要約してください。カスタマーの不満について述べるようにしなさい。\r\nカスタマー: すいません、ちょっとあのクレジットカードの契約を確認したいんですけど、\r\nオペレータ: かしこまりましたクレジットカード契約の確認のお問い合わせですね。\r\nカスタマー: はい。\r\nオペレータ: そういたしましたら、冬、クレジットカード番号はわかりますか。\r\nカスタマー: はいわかります。\r\nオペレータ: お聞きしてもよろしいでしょうか?\r\nカスタマー: はい。1111223334444です。\r\nオペレータ: かしこまりました。そういたしましたらご契約者様の電話番号お願いいたします。\r\nカスタマー: 電話番号は0802223333です。\r\nオペレータ: かしこまりました。\r\nオペレータ: ただいま契約受いただいた情報に基づいて契約状況お調べいたしますので、お待ちください。\r\nオペレータ: お待たせしました。確かに契約内容確認できました。ご契約いただいてるカードは、\r\nオペレータ: スタンダードタイプのカードになります。\r\nカスタマー: なるほど、わかりました。', 'instruction': ''} , {'input': '質問: 太郎くんはりんごを5つ持っています。彼はさらに2つのりんごの箱を買いました。1つの箱には3つのりんごが入っています。太郎くんは何個のりんごを持っていますか?', 'instruction': ''} , {'input': '1から500までの数字を入力するのに何回キーボードを叩く必要があるでしょうか?\r\n\r\n1桁の数字を入力するには1回、2桁の場合は2回、3桁の場合は3回キーボードを叩く必要があるものとします。\r\n\r\n選択肢: (a) 1156 (b) 1392 (c) 1480 (d) 1562 (e) 1788\r\n', 'instruction': '以下のタスクでは、与えられた条件やルールに基づいて問題を解き、最も適切な回答を選択肢から選んでください。計算や推論が必要な場合は、ステップごとに論理的に進め、正しい答えを導き出してください。'} , {'input': '鉛筆は水に沈みますか?', 'instruction': ''} , {'input': '次の文章は正しいですか?\r\n本田圭佑は高校生の時に甲子園で優勝した。', 'instruction': ''} , {'input': '下の会話は音声認識を行った結果で誤りを含んでいる可能性があります。自然な会話に直してください。\r\n\r\nカスタマー: すいません。ちょっと投資信託を始めたいと思ってるんですけど、\r\nオペレータ: かしこまりました新宅空\r\nオペレータ: ですね\r\nオペレータ: お口座、\r\nオペレータ: ご予定お伺いしてもよろしいでしょうか?', 'instruction': '以下のタスクでは、提示された内容に含まれる誤りや不自然な部分を修正し、自然で明確な文章に直してください。修正は文脈や話し手の意図を考慮して行い、会話や文章が流れるように整理してください。'} , {'input': 'ガラスを使い捨てライターで炙ったら燃えますか?', 'instruction': ''} , {'input': 'あなたは先輩と後輩の3人のチームで働いています。先輩は社内の知識に長けていて、後輩は愛嬌がありコミュニケーションが得意です。\r\n\r\nあなたは取引先から契約書Xへの押印を求められました。どうしますか?', 'instruction': ''} , {'input': 'あなたはゲーム会社のプランナーです。新しいアクションゲームを企画することになりました。ゲームのコンセプトを考えてください。', 'instruction': ''} , {'input': '「今日は少し雨が降っている。外出するのは億劫だけど、近くのコンビニまで買い物をしなければならない。傘を持っていくかどうか迷う。」\r\n\r\nこのシチュエーションで、以下の2つの選択肢のメリットとデメリットについて説明してください。\r\n\r\nA. 傘を持っていかない\r\nB. 傘を持っていく', 'instruction': ''} , {'input': '与えられた文について、なぜそのような行動をしたかの理由を推測してください。\r\n\r\n---\r\n\r\n「もう、いい加減にして!」というと彼女は突然立ち上がって、部屋を出ていった。', 'instruction': ''} , {'input': 'あなたは、友人から「最近物忘れがひどくて困っている」と相談を受けました。どのような返事をしますか?', 'instruction': '以下のタスクでは、提示された状況や相談に対して、相手に配慮した適切な返事を考えてください。返事には、共感や助言を含め、相手が安心し、建設的な行動を取れるような内容を盛り込んでください。'} , {'input': '新しいレストランに行きました。メニューを見て、以下の2種類のパスタのどちらを注文するか迷っています。どちらを選ぶべきか、理由を説明してください。\r\n\r\n・トマトソースのスパゲッティ\r\n・クリームソースのペンネ', 'instruction': ''} , {'input': 'ある男性が、高校時代に好きだった女性に再会した。彼女は結婚して子供もいて幸せそうだった。男性は彼女に告白しようと思っていたが、その機会を逃してしまった。彼は後悔しながら、OOとつぶやいた。\r\n\r\nOOにはあることわざが入ります。何でしょう?', 'instruction': ''} , {'input': '山田太郎は、宇宙軍の曹長だった。\r\nこの文に現代として考えられない要素は含まれていますか?', 'instruction': '以下のタスクでは、提示された文や情報に基づいて、矛盾点や現実的ではない要素を特定し、理由を説明してください。分析は論理的かつ具体的に行い、必要に応じて背景情報や補足説明を提供してください。'} , {'input': 'ナイジェリア、ロシア、エジプトの共通点は?', 'instruction': ''} , {'input': '82歳の男性が24歳の友人と、ここ数十年で政治がどれだけ変わったかについて話していました。\r\nQ: 誰が政治の変化を批判しているのでしょうか?\r\n選択肢\r\n- 82歳の男性\r\n- 24歳の友人\r\n- 情報不足', 'instruction': ''} , {'input': 'AさんとBさんは同じ会社で働いています。二人はそれぞれ、仕事でコンピューターを使う必要があることがあります。しかし、そのコンピュータはあまり高性能ではありません。二人が同時にログインすると、たいていクラッシュしてしまいます。そこで、会社は午前中はAさんだけ、午後はBさんだけがパソコンを使うことを許可すると宣言しました。翌日、AさんとBさんはどちらも寝坊して13時からコンピュータで仕事を始めました。そしてその日コンピュータはクラッシュしてしまいました。誰がコンピュータをクラッシュさせてしまったのでしょうか?', 'instruction': '以下のタスクでは、提示された状況や会話内容に基づいて、最も適切な選択肢を選んでください。文脈や明示された情報をもとに論理的な結論を心がけてください。'} , {'input': '次の文のうち、どちらがより意味が通じるでしょうか。\r\n選択肢1: 男が刑務所に行ったのは、ガソリンスタンドを襲ったからだ。\r\n選択肢2: 男がガソリンスタンドに強盗に入ったのは、刑務所に入ったからだ。', 'instruction': '以下のタスクでは、提示された文の意味が正確に伝わるかどうかを分析してください。それぞれの文が持つ文脈や論理的な一貫性を評価し、どちらがより意味が通じるかを選択肢から選びます。必要に応じて、選択理由を簡潔に補足してください。'} , {'input': '日本語では2つの漢字が組み合わさることで熟語となり、新しい意味を持ちます。\r\n新しく熟語を与えるので、その意味を想像してみてください。\r\n杯伝', 'instruction': ''} , {'input': '2つの文字列で連続した最長共通部分文字列の長さを求めよ。\r\n\r\n文字列1: あえおかささででした\r\n文字列2: ばつえおかさでくした', 'instruction': '以下のタスクでは、2つの文字列に対して、連続する最長の共通部分文字列を特定し、その長さを求めてください。部分文字列は、文字列内の連続した文字の組み合わせを指します。どのように解くかの考え方を簡潔に説明してから、求めた文字列の長さを回答をしてください。'} , {'input': '以下の例文はジョーク(皮肉)を言っていますか?\r\nそんなに落とし物をするなんて、今日は重力が強いのかな?', 'instruction': ''} , {'input': '木曜日の5日後は何曜日でしょう?', 'instruction': ''} , {'input': 'この文において「彼」が指すものは何でしょう?曖昧である場合は曖昧であると答えてください。\r\n男は重い病気に罹り、医者は余命を宣告した。彼の心情を考えると胸が苦しくなる。', 'instruction': ''} , {'input': '括弧が正しく閉じられるように、次の配列を完成させてください。\r\n[ < < { } > [ { [ ] ', 'instruction': '以下のタスクでは、括弧の構造が正しく閉じられるように配列を完成させてください。各括弧の種類が開かれた順序で閉じられる必要があります。与えられた括弧の並びを尊重し、不足している閉じ括弧を適切に補完してください。'} , {'input': '以下の文はある数式を自然言語で表したものです。元の数式を四則演算の数式として表してください。\r\n1を3で割った結果に33を足して、210を掛ける。最後に100で割る。', 'instruction': '以下のタスクでは自然言語で記述された文を数式で表現します。計算は実行せず、次のような数字と記号からなる四則演算の数式で表現してください。\r\n回答例:(1/3+33)*210/100'} , {'input': 'ネットスラングでは、似た音を持つ別の短い表現に表されることがあります。例えばサーバーは鯖(さば)と表現されます。\r\n「消防 」というネットスラングはどのような意味を持つでしょうか?', 'instruction': ''} , {'input': '架空の言語「エクル語」と日本語の関係をいくつか示します。\r\n1.\r\nエクル語: ダスインガ ウタ\r\n日本語: 彼が水を飲む\r\n2.\r\nエクル語: ダストン ウタ\r\n日本語: 彼は水を運んだ\r\n3.\r\nエクル語: ダスデル\r\n日本語: 彼は走った\r\n4.\r\nエクル語: クルデル クルインガ ウタ\r\n日本語: 子供が走って水を飲んだ\r\n\r\nここから推測して以下のエクル語を日本語に直してください。\r\n5.\r\nエクル語: クルデル クルトン', 'instruction': ''} , {'input': 'RGB(255, 0, 0)は赤色, RGB(255, 255, 255) は白色を表します。ではRGB(200, 200, 0)は何色でしょう?', 'instruction': 'RGBモデルでは、各値は赤(R)、緑(G)、青(B)の明るさを示し、全てが0だと黒色を、全てが255だと白色を表します。与えられた情報をもとに色の混合による結果を推測してください。'} , {'input': 'あの、娘がやっているあのキ、チックトック?チックトッカー?っていうのは何なんですか?', 'instruction': ''} , {'input': '今日の夕方、東京タワーに行くことはできる?\r\nという問いに答えるのに十分な情報はどれですか?\r\n\r\n情報1: 今日は3/1(金)で、明日は祝日だ。\r\n情報2: 東京タワーの営業状況について: 新型コロナウイルス感染拡大防止の為、営業時間を変更致します。 平日は21時まで、祝日は19時までの短縮営業となります。\r\n\r\n選択肢:\r\n- 情報1のみで十分で、情報2のみでは不十分\r\n- 情報2のみで十分で、情報1のみでは不十分\r\n- 情報1と2の両方で十分\r\n- 情報1, 2のどちらかのみで十分\r\n- 情報1, 2のどちらでも不十分', 'instruction': '以下のタスクでは、まずそれぞれの情報が厳密に決定的な証拠となるか理由とともに説明してください。可能性や推論で判断はせず、与えられた情報からは断定できない場合には「どちらでも不十分」を選択してください。回答は与えられた選択肢から選んでください。'} , {'input': '以下の文章から、話者の推測や感想を除いた客観的な事実のみを抽出してください。\r\n\r\n今日は雨だから遠足は中止になるだろうな? お菓子を買ったから皆と食べようと思ってたのに残念', 'instruction': ''} , {'input': 'あなたは救急隊員として働いていますが、実は不死身の救急隊員です。1000年前の戦場で初めて負傷兵を治療して以来、あなたは年を取らず、世界の発展を遠くから見守ってきました。\r\nQ: あなたは年々、シワが増えていますか?', 'instruction': ''} , {'input': '「必ず時間は守ります」葵と悠が手を繋いで歩き出すと、善吉は口調を荒げ「ふざけるな!娘をどうするつもりだ!」と捲し立てた。悠は「私は彼女を愛しています。私たちは結婚したんです。」と堂々と答えた。\r\n\r\nこの文章において、善吉は悠にとっての何ですか?', 'instruction': '以下のタスクでは、文章に登場する人物の発言や感情の背景を推理して、最後の質問に回答してください。状況が理に適うような回答になるように、人物が何なのか謎を解いてください。'} , {'input': '自動運転に懐疑的な太郎は、友人と「2030年以降、ほとんどの道路を自動運転車が走ることはないだろう」という賭けをした。 翌日、太郎は自動運転車のコンピュータ・ビジョン・システムに不可欠なライダー(LIDAR)技術に関する最新研究を紹介する会議に出席した。その後太郎は友人に賭けをなかったことにしないかと持ちかけた。 次のうち妥当なものを選んでください。\r\n選択肢:\r\n- 太郎はLIDARの会議で自動運転車の会社に投資した。\r\n- 太郎はまだ、自動運転車は今世紀中にうまくいかないと考えている。\r\n- 太郎は、LIDAR技術がうまくいかないことを示唆する何かを会議で学んだ。\r\n- 太郎は会議で自動運転技術の実現可能性に関する信念を変えなかった。\r\n- 太郎は会議で何かを学び、LIDAR技術に驚いた。', 'instruction': '以下のタスクでは、文章に描かれた出来事や人物の行動を分析し、最も適切な選択肢を選んでください。文脈に基づき、行動や発言が示す意図や変化を考慮してください。推測は文中の情報に基づいて行い、選択肢の中で最も妥当なものを選んでください。'} , {'input': '比喩を用いた文1が与えられます。文2が文1の正しい言い換えでしょうか?はいかいいえで答えてください。\r\n\r\n文1: この車はすごくガソリンを食う\r\n文2: この車は美味しそうにガソリンを食べる', 'instruction': ''} , {'input': '以下は2人での会話ですが、誰が何を言ったかは記されていません。\r\n\r\nまあ、そうですね。では今週はこれくらいにして、また来週の会議で話しましょう。え?来週は祝日だって?はい、勤労の日です。あーなるほど。来週の他の曜日はどうですか? ちょっと来週はどこも埋まっちゃってますね。そうですか、では再来週にしましょう。\r\n\r\nここで、「え?来週は祝日だって?」と「ちょっと来週はどこも埋まっちゃってますね。」は同じ人の発言ですか?', 'instruction': ''} , {'input': 'Bさんの発言は「はい」か「いいえ」で言い換えるとどちらですか?\r\nAさん: 準備はできましたか?\r\nBさん: 大丈夫です。\r\n\r\nまた、Dさんの発言は「はい」か「いいえ」で言い換えるとどちらですか?\r\nCさん: 手伝いましょうか?\r\nDさん: 大丈夫です。', 'instruction': '以下のタスクでは、登場人物の日本語的な発言を文脈から分析し、肯定的な「はい」または否定的な「いいえ」のどちらに言い換えられるかを判断してください。以下のタスクでは、登場人物の発言を文脈から分析し、「はい」または「いいえ」のどちらに言い換えられるかを判断してください。発言の意図を正確に読み取り、答えてください。'} , {'input': '次の指示に従った場合、あなたはスタート地点に戻っていますか?\r\n\r\n常に前を向いていてください。1歩下がって。2歩左へ行って。2歩下がって。6歩前進して。3歩、いや2歩右に進んで。', 'instruction': '以下のタスクでは、移動の方向や歩数を正確に計算し、位置を確認してください。'} , {'input': 'サマると8つということですね。\r\n上の文における「サマる」とはどのような意味でしょうか?', 'instruction': ''} , {'input': '下の表はペンギンについてまとめたものです。\r\n\r\n名前, 年齢(歳), 身長(cm), 体重(kg)\r\nルイ, 7, 50, 11\r\nベルナール, 5, 80, 13\r\nヴィンセント, 9, 60, 11\r\nグエン, 8, 70, 15\r\n\r\n例えば、ルイの年齢は7歳、グエンの体重は15kg、ベルナールの身長は80cmです。\r\n\r\nQ: 一番老いているペンギンは誰ですか?', 'instruction': ''} , {'input': '次の文章では、どこかの時点である記事から別の記事へと変わります。あなたのタスクはこの境界を推測し、別の記事に変わった最初の文を記述することです。\r\n\r\nキャットフードの種類が多くて迷いますが、毎日の食事選びの基本は、栄養過不足にならないよう、「総合栄養食」で「ライフステージに合ったもの」を選ぶことです。\r\n基本は「総合栄養食」のドライフードとお水だけでOK\r\nキャットフードには、ドライフードとウェットフードがあります。ドライフード(通称カリカリ)のほとんどは「総合栄養食」なので、フードとお水だけで、猫ちゃんに必要な栄養素を摂取できます。\r\n猫は狩猟動物ですから、狩猟本能が満たされない欲求不満や運動不足も大きなストレス源となります。\r\nキャットタワーやキャットウォークなど、猫が運動しやすい環境を整えてあげたいですね。\r\n猫がストレスを感じると、便秘や下痢、食欲不振、過度なグルーミングといったストレスサインが現れます。時には皮膚炎や膀胱炎といった病気を引き起こす場合もあります。\r\n長期的なストレスは免疫の低下にも繋がるので、「たかがストレス」と思わずに早めに原因を取り除くようにしましょう。\r\n\r\n', 'instruction': '以下のタスクは、文章の前半部と後半部のそれぞれ話題が何であるか読み解き、後半部の話題が最初に記述された文を特定するタスクです。'} , {'input': '昔はよく海に行っていたが、最近ではほとんど泳がない。\r\n上の文章を「滅多に」という言葉を使って言い換えてください。', 'instruction': '以下のタスクは、指示された熟語によって文章を言い換えるタスクです。指示された言葉は必ず用いて回答してください。'} , {'input': 'Q:私の目は黒く、髪は明るい黄色で、足元はしっかりと地面に根ざしています。私は太陽の光を顔に浴びるのが好きです。私の正体は何でしょう?\r\n', 'instruction': ''} , {'input': '大喜利に挑戦してみましょう。大喜利とはお題に対して面白い回答を考える遊びです。大喜利のコツは色々とありますが、1つは「共感を呼ぶ答えをひとひねりする」ことです。誰もが経験したことや思ったことに対して、少し変わった視点や表現で回答することで、共感と笑いを誘うことができます。\r\n\r\n例えば、以下の例を見てみましょう\r\n\r\nお題: ナルシスト漁師の特徴を教えてください\r\n回答: キャッチ&キス&リリース\r\n\r\nこのお題では、「普通の漁師の特徴」の「キャッチ&リリース」に対して、ナルシストという観点からの捻りを加え、語感がいいようにまとめていて面白いです。\r\n\r\nそれでは、以下のお題について大喜利で答えてください。\r\nお題:初めてドラゴンを退治しに行くのですが、アドバイスをお願いします', 'instruction': '以下のタスクでは、最後に提示された「お題」という質問に対してワンフレーズで回答します。例を示すことはせずに、回答は必ず一つだけ示してください。'} , {'input': 'リンゴとバナナはどのように似ていますか?', 'instruction': '以下のタスクでは、提示された対象について、共通点や類似点を分析して答えてください。対象の特徴や性質を比較し、分かりやすく具体的に述べてください。'} , {'input': '仮説: 2人の男女が、赤い薔薇を眺めています。\r\nある前提からこの仮説が導けるかを1~5で評価すると、3になります。どのような前提でしょうか?', 'instruction': '以下のタスクでは、仮説の評価が大きいほど前提から仮説を完全に導け、評価が低いと生成した前提から仮説があまり導けないことを意味します。指定された確度を示すバックグラウンドを導いてください。'} , {'input': 'クイズを作ったのですが、選択肢が思いつきません。QとAを教えるので、それに相応しい選択肢を5つ作ってください。\r\nQ: 主に子ども向けのもので、イラストのついた物語が書かれているものはどれ?\r\nA: 絵本', 'instruction': 'あなたはクイズ職人です。以下のタスクでは、クイズの不正解となる選択肢を作成します。正解と全く異なる意味の言葉で、正解とは脈絡のない単語を選択肢として並べてください。正解に類似した言葉を決して含めないでください。'} , {'input': '和訳後の不自然な文が与えられます。自然な文に直してください。\r\n\r\n和文: 攻撃は驚きを持ってプレイヤーを取った、彼はゲームが終わって、彼の対戦相手が勝つだろうと言うので、彼はちょうど何を決めたのですか?', 'instruction': '以下のタスクでは、不自然な日本語の文を読み取り、意味が通る日本語に修正してください。文脈や意図を考慮し、元の文の情報を損なわないようにしてください。'} , {'input': 'ある生徒が記事の要約をしました。この要約をより良く直してください。\r\n\r\n記事:\r\n小売店や飲食店では、税抜き価格が強調されている一方で、税込み価格が小さく書かれているケースが比較的多く見受けられます。税抜き価格を強調する店が多いのはなぜでしょうか。考えられる理由について、教えてください。\r\n\r\n黒田さん「税抜き価格を強調することで、安く感じる顧客がいるため、結果として売り上げが伸びる可能性があることが考えられます。総額表示が義務付けられる前は、小売店や飲食店では、一般的に税抜き価格のみの表示が多かったです」\r\n\r\nでは、税込み価格を強調した場合、売り上げに影響が出る可能性があるということでしょうか。\r\n\r\n黒田さん「影響はあると思います。次のような表示が『総額表示』として認められます。\r\n\r\n(1)1万1000円(税込)\r\n(2)1万1000円(うち消費税額等1000円)\r\n(3)1万円(税込価格1万1000円)\r\n\r\nこれらの表記が並んでいた場合、(3)が目を引き、安く感じるのではないでしょうか。\r\n\r\n生徒の要約:\r\n小売店や飲食店では税込み価格が小さく書かれているケースが多いです。税込み価格を強調した場合、売り上げに影響が出る可能性があります。', 'instruction': '以下のタスクでは、与えられた記事をより良い文章に書き直し、改善点を説明してください。'} , {'input': 'レンタルビデオ屋で「ブルーレイはありません」と言われました。この発言が暗に意味することは何でしょうか?', 'instruction': '以下のタスクでは、発言が逆に示していることを考慮し、その理由について適切な解釈を行ってください。'} , {'input': '次の言葉を順に全て使って、1つの文を書いてください\r\n\r\n全力、安全、活用、軽減', 'instruction': ''} , {'input': '次の検索クエリに最も相応しいページのタイトルを選んでください。\r\n\r\n検索クエリ: 竜のあごの下にある鱗のことで、目上の人を怒らせた時にここに触れると表現されるのは何でしょう?\r\n\r\n1. 竜の生態について\r\n2. 人を怒らせた時の対処方法\r\n3. 慣用表現一覧: 怒り・悲しみ', 'instruction': '以下のタスクでは、検索クエリの内容を注意深く分析し、最適であるタイトルを選択してください。'} , {'input': 'あるQAのAをもとに、どんなQだったかを考えてください。\r\nA: ズボンとパンツは基本的に同じものを指し、現在明確な違いが定義されているわけではありません。 下着との区別をするためわざとズボンと表記している場合もあります。 間違いではないので、ズボンと呼んでもパンツと呼んでも問題ありません。 自由に呼びましょう。\r\n\r\n', 'instruction': ''} , {'input': '「愛飲」を簡単な表現に言い換えて。', 'instruction': '次のタスクでは元の意味を損なわないように注意しながら、わかりやすい言葉を選んでください。'} , {'input': '「会場に女性がいた。」という文は「どこに女性がいた?」という疑問文に直すことができます。\r\nこのとき、 "会場" という単語は "どこ" という疑問詞タグを持ちます。疑問詞タグには いつ, どこ, だれ, なに, どれくらい があります。\r\n\r\nそれでは、「ドライバー」という単語はどのような疑問詞タグを持つでしょうか? 全て選んでください。対応するものがない場合は"なし"と答えてください。', 'instruction': '以下のタスクでは、それぞれの疑問詞タグを用いて与えられた単語が答えとなる疑問文が作れるかを考えます。対応する疑問詞は与えられた単語と完全に置き換えることができます。次の例を参考に、対応する疑問詞タグを選択してください。'} , {'input': 'マウスには (A) ネズミ, (B) 口, (C) コンピュータの入力機器 の3つの意味があります。下のそれぞれの選択肢ではどのような意味で使われているでしょうか?\r\n\r\n1. マウスウォッシュ\r\n2. マウスカーソル\r\n3. ミッキーマウス\r\n4. マウスパッド\r\n5. マウスピース\r\n6. マウスツーマウス法\r\n', 'instruction': '以下のタスクでは、それぞれの単語に対して選択肢の中から最も適した意味を選択します。提示された全ての選択肢から単語の多義性を考慮して判断してください。'} , {'input': '1. 彼は比類のない陸上選手だ。\r\n2. 彼は比較的に良い陸上選手だ。\r\n\r\n1の文が難しいので2の文に直そうと思っているのですが、これってあってますか?\r\n', 'instruction': ''} , {'input': 'ティム: やあ、調子はどう?\r\nキム: いろいろやろうとしてたんだけど、また先延ばしにしちゃったよ。\r\nティム: 何をしようとしていたの?\r\nキム: 大学の課題だよ。どうにもやる気が出なくてね。\r\nティム: 集中できないなら、ポモドーロ・テクニックをするといいよ。\r\nキム: 何それ?\r\nティム: 25分作業して、5分休憩するのを繰り返すんだよ。一回あたりの作業時間が短くて集中できるよ。\r\nキム: うーん、集中っていうわけじゃないんだよね\r\nティム: じゃあ1日に5分だけでいいから机で課題をするっていうのはどう?\r\nキム: 5分じゃ何もできなくない?\r\nティム: 短い時間でもいいから机で作業するっていうのがポイントなんだよ。むしろもっとやりたい、くらいで止めておくと毎日続くもっと長い時間できるようになるよ。\r\nキム: 確かにそれならできるかも。ありがとう!\r\n\r\nQ: キムは何をやってみようとしていますか?また何故それをやろうとしていますか?', 'instruction': ''} , {'input': '「スキーストック 選び方」と検索しているユーザーが他に興味を持ちそうな検索クエリをいくつかあげてください。', 'instruction': ''} , {'input': 'youtubeの台本を書くのを手伝ってください。\r\n\r\nタローとコタローという2人のキャラクターの対話ベースで進行します。\r\n\r\nタローは物知りで、コタローの疑問に答えてくれます。\r\n\r\n今回の動画は、映画スラムダンクを視聴者に薦める動画です。以下のポイントを押さえた脚本にしてください。\r\n\r\n- まるでスポーツの試合を見ているかのように迫力のあるバスケのシーン\r\n- 漫画の原作を読んだことのない人でも楽しめる、映画として完結しているストーリー\r\n- 来月に公開が終了する\r\n- 10行~15行程度の対話', 'instruction': ''} , {'input': 'あなたは以下の道具を持っています。これらの道具を必要なだけ使って、今日の昼ごはんを準備してください。\r\n\r\nチラシ: 宅配ピザならピザジャンボ! S: 900円, M: 1200円, L: 1600円 電話番号も書いてある。\r\n鍵: 家の戸締りに使う\r\n携帯: 古いのでネット検索はできないが電話をするには十分\r\nポイントカード: ラーメン屋のポイントカード\r\n財布: 1000円しか入っていない。', 'instruction': '以下のタスクでは、提示された道具と条件を考慮し、それらをどのように使えば目標を達成できるかを答えてください。具体的な使い方を説明し、目標を達成するために必要な行動を考慮してください。'} , {'input': '以下のシチュエーションでの適切な発言をいくつか考えてください。\r\nシチュエーション: 誰かが無事に到着したとき', 'instruction': ''} , {'input': '新入社員のオンボーディングをしています。\r\n\r\n会社のメールアカウントなどのITセットアップは概ね完了して、社内のドキュメントも閲覧できる状態です。また新人研修なども実施し、業務の説明などをそこで行う予定です。\r\n\r\n他に何かすべきことはありますか?特に新入社員が早く馴染めるようにするにはどうしたら良いでしょうか', 'instruction': ''} , {'input': '次のリストを昇順で並び替えて。出力は入力と同じフォーマットのリストのみを返し、余計なことを喋らないで。\r\n\r\n[10, 92, 2, 5, -4, 92, 5, 101]', 'instruction': '以下のタスクでは、リストを出力します。'} , {'input': 'あなたは古代エジプトの貴族です。冠位によって割り振られた土地について税を納めようとしています。しかし、ある土地についてどの貴族が所有しているかを知りません。以下はその土地の形状と特徴です。\r\n- 南北に細長い\r\n- ナイル川から東に離れている\r\n- 西側は岩山になっている\r\nこの土地は誰が所有しているのでしょうか?', 'instruction': '以下のタスクでは、提示された状況や条件を整理します。不明な場合は不明であると答え、与えられた情報をもとに理由とともに回答してください。'} , {'input': '「じまん」と「ほこり」、どちらの方がポジティブな意味を持っていますか?その理由も述べてください', 'instruction': ''} , {'input': 'あなたは、小説の執筆者です。以下は小説の一文です。\r\n「風が強く吹いていた。」\r\nこの文章に対して、どのような表現を追加することで、風の強さがより強く表現できるか、答えを書いてください。', 'instruction': '以下のタスクでは、与えられた文章を分析し、最後の指示に従って内容を強調する文章に書き換えてください。文章のテーマや意図を深めるために、情景を思い浮かび上がらせるような表現を追加してください。'} , {'input': '小説のセリフを書くことを手伝ってください。物語の中で、主人公は学校生活での人間関係に問題があります。彼には母親がいますが、母親は彼に良い大学に行ってほしいという気持ちからハードな勉強を押し付けてしまっています。\r\n\r\nここで、最終的に主人公の気持ちを理解することができた母親のセリフを考えてください。\r\n', 'instruction': '以下のタスクでは、登場人物の感情や状況を分析し、物語のクライマックスにふさわしいセリフを考えてください。発言者のキャラクターの性格や状況に基づいて、セリフが物語に深みを与えるものになるよう工夫してください。'} , {'input': '「生き物デザイナー」という職業があります。これは、自分が考えたオリジナルの生き物をデザインし、実際にDNAを編集して作り出す仕事です。あなたが生き物デザイナーである場合、どんな生き物を作りたいですか?また、その生き物が持つ特徴や能力について説明してください。', 'instruction': '以下のタスクでは、創造力を活かして架空の設定になりきり、与えられた設定や条件を参考に、特徴や能力についてのオリジナリティのある提案を行い、その理由を詳しく説明してください。'} , {'input': '犬が「ワンワン」ほえるなど、音や声を直接表す言葉を「擬音語」、星が「きらきら」光るなど、ものや人の様子を直接表す言葉を「擬態語」といいます。\r\n\r\n下の文を読み、擬音語・擬態語をそれぞれリストアップしてください。\r\n\r\n窓辺に座り、ぼんやりと外を見ていると、パラパラと雨が降り始めました。ビシャビシャと音を立てる雨に、私は何でもない場面にワクワクした気持ちを抱きました。', 'instruction': '以下のタスクではまず説明文が示され、最後に最も重要な文章が提示されます。説明文を除外して、「擬音語」と「擬態語」のそれぞれについて文章中に含まれるかを考えてください。。'} , {'input': '以下の文章について、筆者がどのような意図でこの文章を書いたか、あなたならどのように解釈しますか。\r\n\r\n彼はバブル期に大金持ちになり豊かな生活に日夜明け暮れたが、バブル崩壊後にほとんどの資産と職を失った。彼女に出会ったのは、そんな人生が真っ暗になってしまっていたときだった。彼は現在アルバイトで貧しいながらも生計を立てているが、それでも彼は今が一番豊かだと言っている。', 'instruction': '以下のタスクでは、与えられた文章から筆者の意図やメッセージを推測してください。記述された状況を考慮した上で、その理由についても明確に述べてください。'} , {'input': '花粉症の方々にとって、春は憂鬱な季節です。しかし、春には素敵な花や新緑もたくさんあります。そこで、花粉症でも春を楽しむコツを3つ考えてください。', 'instruction': ''} , {'input': '漢字に対応する意味を選び、対応する数字とアルファベットのペアを解答してください。\r\n\r\n1. 立派\u3000A. すばらしい\r\n2. 開拓\u3000B. ある事柄について知っている内容。\r\n3. 知識\u3000C. 物事に味わいや価値を加える\r\n4. 賞賛\u3000D. 新しい領域を切り開く\r\n5. 味付け\u3000E. 高い評価を与える', 'instruction': '以下のタスクでは、最も妥当なペアリングを考えてください。'} , {'input': '次の物語の展開を予想してみましょう。\r\n\r\nある日、主人公のもとに不思議な手紙が届きました。手紙には「今夜の満月に、森の奥深くにある洞窟に来てください。あなたを待っています。」と書かれていました。主人公はその手紙に従い、夜中に洞窟の入り口にたどり着きました。中に入ると、謎めいた人物と出会い……。', 'instruction': '以下のタスクでは、与えられた物語の設定や状況を基に、豊かに物語の続きを創造してください。'} , {'input': '次の文は1つの物語の文の順番をシャッフルしたものです。適切な順に並び替えてください。\r\n\r\n1. 「果物だけではなく、人生も同じです。協力しなくては、全てをこなすことはできません。」\r\n2. 老人は、広い畑で色々な果物を育てていました。\r\n3. ある日、孫が老人に『こんなに広い畑で、全ての果物を一人で育てるのは大変そうですね』と尋ねました。\r\n4. 昔、あるところに老人と孫がいました。\r\n5. 老人は微笑みながら次のように答えました。\r\n', 'instruction': '以下のタスクでは、文脈や物語の展開を考慮し、ストーリーが自然になるように順序を整えてください。'} , ] df_elyza_inst = pd.DataFrame(instruction_data) df_elyza_inst.loc[pd.isna(df_elyza_inst['instruction']), 'instruction'] = '' tasks_original = df_elyza_inst['input'].values import json datasets = [] with open(inputfile, "r") as f: item = "" for line in f: line = line.strip() item += line if item.endswith("}"): datasets.append(json.loads(item)) item = "" def calculate_similarity(query, text): return SequenceMatcher(None, query, text).ratio() # 学習したモデルを用いてタスクを実行 from tqdm import tqdm # 推論するためにモデルのモードを変更 FastLanguageModel.for_inference(model) # model.eval() results = [] for dt in tqdm(datasets): query = dt["input"] similarities = [calculate_similarity(query, doc) for doc in tasks_original] match_result = np.array(similarities) max_idx = np.argmax(match_result) instruction = df_elyza_inst.loc[max_idx, 'instruction'] if len(instruction) > 0: prompt = f"""### 指示\n{instruction}\n\n{query}\n### 回答\n""" else: prompt = f"""### 指示\n{query}\n### 回答\n""" inputs = tokenizer([prompt], return_tensors = "pt").to(model.device) outputs = model.generate(**inputs, max_new_tokens = 1024, use_cache = True, do_sample=False, repetition_penalty=1.2) prediction = tokenizer.decode(outputs[0], skip_special_tokens=True).split('\n### 回答')[-1] results.append({"task_id": dt["task_id"], "input": '', "output": prediction}) # jsonlで保存 import datetime now = datetime.datetime.now() with open(savefile, 'w', encoding='utf-8') as f: for result in results: json.dump(result, f, ensure_ascii=False) f.write('\n') ```