jupyter沈黙中
ただいま、使っているエディタがjupyternotebookなんですが、printで出力しても返してくれない、沈黙中です。どうも困ってるhuloです。
上記のような理由のため、コードは書いたけどエラー出るだろうし、欲しい結果が出るとは限らないので、ご了承を。途中でやめようかと思ったけど、コード書くだけ書いといて、明日にでもまとめて確認&修正していけばいいやとか思ってます。明日は原因追及及び課題修正がメインですね。進めれたら直義って感じですね。ちなみにvscodeやターミナル上でコピペして実行してみたんですが、どちらもなんにもかえしてくれなかったです。あせあせ
今日のコードメモ
import json
import csv
import numpy as np
import pandas as pd
def count_df(courses,vocab):
df={}
for word_id, word in enumerate(vocab):
count=0
for c in courses:
if word in c:
count+=1
df[word_id]=count
return df
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
print(len(df))
#コースの中にキーワードが何回入っているか辞書で返す
import numpy as np
def count_df(courses,vocab):
df={}
for word_id, word in enumerate(vocab):
count=0
for c in courses:
if word in c:
count+=1
df[word_id]=count
return df
def lec_word_tfidf_matrix(courses, vocab,df):
lec_word=np.zeros((len(courses),len(vocab)),dtype=int)
for i in range(len(courses)):
for j in range(len(vocab)):
les_word[i][j]=courses[i].count(vocab[j])*np.log(len(courses)/df
print(lec_word)
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
lec_word_tfidf_matrix(courses, vocab,df)
#tfidfを調べてリストに入れる
import numpy as np
def count_df(courses,vocab):
df={}
for word_id, word in enumerate(vocab):
count=0
for c in courses:
if word in c:
count+=1
df[word_id]=count
return df
def lec_word_tfidf_matrix(courses, vocab,df):
lec_word=np.zeros((len(courses),len(vocab)),dtype=int)
for i in range(len(courses)):
for j in range(len(vocab)):
les_word[i][j]=courses[i].count(vocab[j])*np.log(len(courses)/df
return lec_word
def cos_sim(vec1,vec2):
return np.dot(vec1, vec2) / (np.linalg.norm(vec1) * np.linalg.norm(vec2))
def find_similar_course(target,matrix,courses):
similar_courses = {}
for i, course in enumerate(courses):
if i != target_index:
similarity = 1 - cos_sim(courses.index([title],matrix[i])
if similarity > 0:
similar_courses[course] = similarity
print(similar_courses)
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
courses = list(open("course_list.csv"))
vocab = list(open("keyword_list.csv"))
df=count_df(courses,vocab)
matrix=lec_word_tfidf_matrix(courses, vocab,df)
title="医学データの統計解析実習"
find_similar_course(courses.index([title]),matrix,courses)
#cos類似度の近い数値の要素を取りだす
書かないといけないコードの内容が難しくなってきてAI様様て感じです。明日はコードのチェックしてもらえたらコメントでフィードバックしてほしいです。