パラメータが160M(0.16億?)という小ささのopen-calm-smallを使ってみました!
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
model = AutoModelForCausalLM.from_pretrained("cyberagent/open-calm-small", torch_dtype=torch.float32)
model = model.to('cpu')
tokenizer = AutoTokenizer.from_pretrained("cyberagent/open-calm-small")
inputs = tokenizer("AIによって私達の暮らしは、", return_tensors="pt").to(model.device)
with torch.no_grad():
tokens = model.generate(
**inputs,
max_new_tokens=1000,
do_sample=True,
temperature=0.7,
top_p=0.9,
repetition_penalty=1.05,
pad_token_id=tokenizer.pad_token_id,
)
output = tokenizer.decode(tokens[0], skip_special_tokens=True)
print(output)
CPUで十分です。
AIによって私達の暮らしは、
というプロンプトに対してどのような返答がくるでしょうか。
4連発いってみます。
随分長いなと思ったら49秒かかった。
医療従事者?
8秒。ここで出ている会社や個人の情報はopen-calm-smallの出力であり
正確なものではない可能性があります。
明らかに訓練データの中にネットで拾ってきた企業のウェブサイトの情報が含まれていることがわかりますね。
ここで出ている企業や個人名はopen-calm-smallの出力であり
正確なものではない可能性があります。
temparetureを0.1にして試してみます。
訓練データの中にウシジマくんでもいたのかな…?
おしまい