( 前期提要:因為在大二上修了大數據概論
期末功課老師出了一些題目讓我們實作
本質是不難,因為只需要複製貼上他人打好的程式
但是執行時還是難免遇到一些問題
就在這裡把我遇到的問題做個總整理 )
Input 順序以這個網站為準: https://www.kaggle.com/yelp-dataset/yelp-dataset
使用anaconda裡的jupyter notebook
In[1]:!ls -al ../input/
這一行我直接略過,我有把../input/改成路徑,或是把!拿掉,但是不知道哪裡錯,知道的可以在底下留言告訴我! 謝謝~總之這一行大概只是查看那個資料夾的檔案和權限。
In[2]:在import的時候,會有錯誤訊息告訴你沒有什麼module,這時候可以直接開啟anaconda下指令的視窗,打 pip install +缺的module。
或是打開anaconda navigator,左邊一排有environment,點擊後顯示已經install的,選uninstall點擊那些為下載的按apply,就可以知道裡面的module。
另外,module folium在環境裡面找不到,也沒有basemap,所以可另外在這個網站下載: http://www.lfd.uci.edu/~gohlke/pythonlibs/
我自己是下載basemap‑1.2.2‑cp38‑cp38‑win_amd64.whl,cp後面代表python版本,amd後面的指windows的32or64 。
下載好後一樣放到某個路徑,指令pip install +該檔案路徑,載好後pip install folium。
另外,module folium在環境裡面找不到,也沒有basemap,所以可另外在這個網站下載: http://www.lfd.uci.edu/~gohlke/pythonlibs/
我自己是下載basemap‑1.2.2‑cp38‑cp38‑win_amd64.whl,cp後面代表python版本,amd後面的指windows的32or64 。
下載好後一樣放到某個路徑,指令pip install +該檔案路徑,載好後pip install folium。
In[3]: business =pd .read_csv ("../input/yelp_business.csv" )
../input/一樣改成路徑(放置yelp_business.csv的)
其中因為我從kaggle上下載下來是json,改成csv讀取後也很奇怪(用In[4]:business.head()查看)
所以我改成:
business=pd.read_json("/Users/user\Documents/yelp_academic_dataset_business.csv",lines= True)
一開始我只有business這個檔案可以這樣做,但隔幾天+試了n次,其他檔案也可以了。
business=pd.read_json("/Users/user\Documents/yelp_academic_dataset_business.csv",lines= True)
一開始我只有business這個檔案可以這樣做,但隔幾天+試了n次,其他檔案也可以了。
參考網站: https://towardsdatascience.com/converting-yelp-dataset-to-csv-using-pandas-2a4c8f03bd88
In[42]:import community
原本是應該下載community,這邊要下載 python-louvain
改成 import community.community_louvain
In[43]:nx.draw_networkx (influencers_sub_graph , pos = pos , cmap = plt .get_cmap ( "jet" ), node_color = values, node_size = 0.3, with_labels = False , scale =2 )
最後 ,scale=2 的部分刪掉
以上,感謝觀看~
留言
張貼留言