How to Display Chinese Characters in ggplot2

Introduction

In this post, I am going to demonstrate how to display Chinese characters in ggplot2

#loading necessary packages
library(rvest)
library(xml2)
library(tidyverse)
library(tidytext)
library(knitr)

Let’s get our text data by scraping Chien-Ming Wang’s page on Wikipedia. I will not explain the process of web scraping in this post (but will do this in another post). The focus is on displaying Chinese character in ggplot2.

Web scraping part starts here:

#get access to Wang's wiki page
wang <- "https://zh.wikipedia.org/wiki/%E7%8E%8B%E5%BB%BA%E6%B0%91_(%E6%A3%92%E7%90%83%E5%93%A1)"
#read HTML and capture the HTML code
wanghtml <- read_html(wang)
#display our HTML object
wanghtml
## {html_document}
## <html class="client-nojs" lang="zh" dir="ltr">
## [1] <head>\n<meta http-equiv="Content-Type" content="text/html; charset=UTF-8 ...
## [2] <body class="mediawiki ltr sitedir-ltr mw-hide-empty-elt ns-0 ns-subject ...
#compactly display the structure of the webpage
str(wanghtml)
## List of 2
## $ node:<externalptr> 
## $ doc :<externalptr> 
## - attr(*, "class")= chr [1:2] "xml_document" "xml_node"
#find all the <div> nodes in the body of the page that have a class name containing 'mw-body-content mw-content-ltr'
bio <- wanghtml %>% 
 rvest::html_nodes('body') %>% 
 xml2::xml_find_all("//div[contains(@class, 'mw-body-content mw-content-ltr')]") %>% 
 rvest::html_text()

#finally, we have our raw text data
bio_df <- data.frame(bio)

#clean the raw data a little bit
#remove the part in the wiki that is not related to his bio
bio_df<-gsub("臺灣出生大聯盟選手列表.*","",bio_df)
bio_df<-as.data.frame(bio_df)
bio_df<-bio_df %>% rename(text = 1)
#remove numbers, punctuation, and English words
bio_clean<-bio_df$text %>%
 str_remove_all("\\n|[:digit:]|[:lower:]|[:upper:]|[:punct:]") 

Now we have our clean data that is ready for analysis.

kable(bio_clean)
x
>  關於与王建民 棒球員標題相近或相同的条目請見王建民王建民皇家隊時期的王建民中信兄弟 背号二軍投手教練出生 年月日歲 臺灣臺南縣關廟鄉新埔村今臺南市關廟區新埔里打擊右投球右首秀年月日代表紐約洋基生涯成績 年球季止勝投敗投中繼救援三振四壞防禦率球队 美國職棒紐約洋基小聯盟短年華盛頓國民年多倫多藍鳥小聯盟年辛辛那提紅人小聯盟年芝加哥白襪小聯盟年亞特蘭大勇士小聯盟年西雅圖水手小聯盟年堪薩斯市皇家年獨立聯盟南馬里蘭藍蟹英语 獨立聯盟英语 年教練時期紐約洋基小聯盟客座教練年月日月日中華職棒富邦悍將二軍客座投手教練年月日月日年月年月日世界棒球強賽中華成棒隊牛棚教練年月日年月日中信兄弟二軍客座投手教練年中信兄弟二軍投手教練年 獎牌記錄代表 中華臺北男子棒球亞洲運動會年韓國釜山廣域市亞洲棒球錦標賽年日本北海道王建民英語 年月日是臺灣職業棒球運動員位置為投手臺南市關廟區人曾效力於美國職棒大聯盟紐約洋基華盛頓國民多倫多藍鳥堪薩斯市皇家等隊在大聯盟個球季累計勝敗是台灣投手在大聯盟中累計勝投最高者許多臺灣媒體在報導王建民的新聞時常暱稱其為建仔王葛格臺灣之光美國媒體也稱之為 並稱王引起的風潮為王建民現象目录 早年生活 求學階段 業餘棒球 前往美國 美國職棒 紐約洋基 多次受傷 華盛頓國民 多倫多藍鳥 小聯盟出賽 堪薩斯市皇家 教練時期 球員分析 投球風格 生涯數據 私人生活 個人成就 獲獎記錄 其它榮譽 另見 參考資料 外部連結早年生活编辑求學階段编辑 王建民的出生地臺南縣關廟鄉王建民於年月日出生在台南縣郊區關廟鄉新埔村今臺南市關廟區新埔里之後主要於台南市成長生父王炳穎三叔在家排行第三小時候因為大哥王炳煌無子嗣王炳穎便決定將王建民過繼至長兄戶口下由其大伯養育長大其大伯經營工廠 王建民在就讀崇學國小期間因不喜歡唸書且身高過人而加入籃球校隊在兼任籃球與棒球校隊教練的鼓勵下開始打棒球於校隊徵選時自願加入棒球隊在崇學國小少棒隊中擔任投手年時王建民當選成為第九屆世界軟式少棒錦標賽中華代表隊球員成為其第一次入選出國比賽的代表隊選手就讀建興國中時經由教練張錫杰調教後在未來的發展上奠定了深厚的根基建興國中在王建民之後也培養岀郭泓志胡金龍羅錦龍等職棒選手儘管養父母強烈反對他打棒球希望他能夠成為企業家但在王建民決心毅力與堅持最後還是讓他繼續打球青棒時期的王建民選擇加入傳統青棒勁旅榮工隊當時的榮工隊即中華中學的前身總教練為蕭文勝在榮工隊時期高中生的王建民逐步強化了自身的投球能力與體格擁有達公分的身高與增重後勻稱的身材最快球速也進步到了左右國外球探亦開始將王列入觀察名單年榮工青棒隊獲得全國棒球選拔賽冠軍王建民也因此入選在加拿大舉行的第十七屆世界青棒錦標賽中華代表隊選手由於需要辦理出國護照等證件王建民便請父母將戶籍資料從家鄉臺南寄至球隊所在的臺北但也因此發現戶籍謄本資料上登記自己為養子無法接受事實的王建民連夜趕回台南詢問父母才知道親生父母是自己的三叔業餘棒球编辑在發現自己的三叔是親生父親而從小扶養長大的父母則是養父母後王建民一開始無法接受事實甚至一度不肯打球最後在長輩與教練勸說下才慢慢接受事實並重新投入棒球運動年王建民進入台北市立體育學院就讀並成為第三屆亞洲青棒錦標賽中華青棒代表隊由於獲得曾效力日本職棒的總教練高英傑指導及獲得有指叉球王子之稱的學長蔡仲南教導指叉球下王建民投球技術獲得進一步提升在年台灣青棒則是蓬勃發展同年曹錦輝投出台灣青棒史新高的快速球而左投的郭泓志也達到加上世界青棒錦標賽在臺灣舉行很多國外球探紛紛來到台灣而在同年王建民除了參加三國四強國際棒球邀請賽第八屆荷蘭港口盃中華成棒代表隊外也投出多場精彩的比賽其中他在梅花旗大學棒球賽預賽上對強敵文化大學完投九局只被打出七支安打而且送出次三振率隊以比取勝上大學之後才學的指叉球在這一役發揮得淋漓盡致年王建民在大揚盃四國五強成棒邀請賽與甲組成棒春季聯賽中表現優異除了投出業餘時期的極速其滑球也受到球探的註記包括台灣大聯盟中華職棒興農牛日本職棒中日龍乃至於美國職棒大聯盟的西雅圖水手波士頓紅襪亞特蘭大勇士洛杉磯道奇紐約大都會洛杉磯安納罕天使科羅拉多落磯亞利桑那響尾蛇與紐約洋基等球隊都對他展現出極大的興趣雖然亞特蘭大勇士開出的價碼比紐約洋基還要來得高但因為偶像羅傑克萊門斯的關係王建民最後選擇投入紐約洋基前往美國编辑 到了美國後王建民學會其重要的球種伸卡球年月日與紐約洋基隊簽下萬美元含萬學費與萬旅費簽約金額的小聯盟合約王建民以交換學生的身份前往洋基隊的小聯盟系統出賽王建民從小聯盟的短期球隊出發並投出不錯表現然而在年王建民就因肩關節唇撕裂施行關節鏡手術本年度日程都在復健直到年月才在球隊復出年月王建民接受中華成棒代表隊徵召參加第十四屆南韓釜山亞運其中王建民在中華隊對日本的準決賽中接替先發投手宋肇基後援又局而無失分勝投幫助中華隊打進金牌戰年開始王建民首度獲邀參加大聯盟春訓熱身賽並升上球隊同年月他再度接受中華成棒代表隊徵召參加日本札幌舉辦的第二十二屆亞洲棒球錦標賽王建民於中華隊的先發對戰南韓局失分而無關勝敗並取得體育補充役資格儘管之後王建民一度有放棄在美國的職業棒球而返回臺灣的念頭但隨著迎娶吳嘉姈為妻子兩人並共同至美國生活後改觀年年初王建民至台南官田營區入伍接受軍事訓練天之後以接受大聯盟紐約洋基隊代訓名義出國再度獲邀參加大聯盟熱身賽但只投人次就因傷退場這年王建民還是從球隊出發並在季中順利升上球隊升上後的夏天在投手教練尼爾艾倫英语 及捕手薩法沙諾英语 的指導下王建民開始練習投伸卡球成為日後在大聯盟崛起的招牌球種此外王建民也連續三年接受中華成棒代表隊徵召於該年參加希臘舉辦的第二十八屆雅典奧運美國職棒编辑紐約洋基编辑 年的王建民以勝之姿拿下美聯勝投王各項數據皆為生涯年年月王建民在大聯盟春訓熱身賽投出出色成績開季從球隊出發年月日在小聯盟待了年的王建民於睡夢中被通知升上大聯盟年月日美東時間下午時分王建民在大聯盟初登板面對多倫多藍鳥最終無關勝敗成為第一個在洋基出賽的台灣棒球選手也是台灣第三位登上美國職棒大聯盟的球員及繼曹錦輝之後第二位登上大聯盟的台灣籍投手年月日王建民在主場率領洋基擊敗西雅圖水手獲得大聯盟生涯第一勝在年大聯盟球季例行賽中王建民新人球季共出賽場有次先發和次中繼戰績勝敗同年洋基隊晉級季後賽王建民因而在月日成為台灣第一位於美國職棒大聯盟季後賽出賽的投手年球季王建民憑藉著優異的下沉快速球又稱為快速伸卡球在洋基隊先發輪值中表現優異並因投球特性而獲得滾地球王子稱號同年月日王建民在主場對坦帕灣魔鬼魚完封對手局而只被擊出支一壘安打這是王建民生涯第二次完投也是大聯盟生涯第一次完投完封勝最後其在年大聯盟球季例行賽拿下勝敗與明尼蘇達雙城的王牌左投友漢桑塔那並列該年度的大聯盟勝投王也是大聯盟第一位亞洲籍的勝投王同時超越南韓投手朴贊浩在年創下的勝成績成為在美國職棒大聯盟單季最多勝紀錄的亞洲籍投手年季後賽首輪美國聯盟分區賽王建民於月日在主場對戰底特律老虎並成功拿下勝投除了是個人季後賽首勝外也成為大聯盟史上第一位在季後賽獲得勝投的亞洲投手並且是紐約洋基在該年度季後賽的唯一一場勝投年月日王建民獲得美國職棒美國聯盟賽揚獎票選得分第名 年的王建民第二次拿下勝三振數次為生涯新高年月日王建民因為於春訓時拉傷大腿錯失主投洋基年球季的開幕戰在傷勢復原後復出的王建民在月日於客場對上坦帕灣光芒吞下首敗不過儘管面臨二連敗同年月時確定入選為時代雜誌年全球百位最有影響力人物成為台灣第三位獲得此榮譽的人物年月日王建民在主場對水手的比賽中主投局僅失分還投了局的完全比賽雖然在局上遭擊出陽春全壘打但瑕不掩瑜王建民年球季首場勝投到手年月日王建民主場迎戰響尾蛇與響尾蛇的王牌布蘭登偉伯展開一場滾地球大師的對決戲碼王建民主投局被敲支零星安打掉分外加略勝第一局挨了三分砲的偉伯局掉分一籌最後洋基留下勝利建仔也獲得勝投賽後響尾蛇總教練鮑勃馬文說過去他形容自家王牌偉伯的伸卡球像磚塊但王建民的伸卡球卻像鉛球年月日王建民在主場對上紐約大都會主投局投出在大聯盟生涯新高的次三振最後也獲得勝投年月日他在主場對洛杉磯安那罕天使隊主投又局而締造生涯新高的連勝同時達成對美聯隊伍除了洋基之外均有獲勝的紀錄年月日美國聯盟分區賽王建民生涯首度在僅休息天的情況下再度先發但主投局又人次便丟分退場最終洋基輸給克里夫蘭印地安人在系列賽以被淘汰王建民在該系列賽中雖然吞下連場敗投被打爆不過在年球季結束王建民仍取得勝敗的成績勝投數並列聯盟第二名除了維持自己創下的勝的亞洲投手紀錄外也成為洋基隊史上第二位連續年拿下勝的王牌投手許多洋基球員也表示讚揚多次受傷编辑 年月日的一場比賽中王建民即將被換下場總教練手上拿著球就代表原投手要被換下場的意思年春訓期間已經在大聯盟投滿年的王建民因為超級二年級生條款正式取得薪資仲裁資格由於在洋基陣容中逐漸被視為王牌因此進行生涯首度仲裁提出年薪萬美元儘管最後仲裁失敗而由洋基球團開出的年薪萬美元勝出但也成為台灣運動史上第一位年薪破億的運動員年月日被視為重要王牌球員的王建民擔任洋基年開幕戰先發為其職業生涯首度擔任球隊開幕戰先發投手此戰迎戰多倫多藍鳥王建民繳出主投局失分的優質先發終場洋基以獲勝王建民也拿下年第勝年月日在客場對芝加哥白襪主投局獲勝以生涯先發場比賽取得生涯第勝是亞洲投手最快達到第勝的球員紀錄也是繼年紐約大都會投手德懷特古登以生涯先發場奪勝後近年來最快達此記錄的大聯盟投手在年球季王建民再度獲得時代雜誌年全球百位最有影響力人物也獲選史上第一位以棒球員身份拿下的第屆十大傑出青年獎不過在月日王建民於客場對上休士頓太空人雖然主投局無失分而獲得勝投但比賽途中他從太空人王牌投手洛伊奧斯華手中打出短打上壘再從二壘跑回本壘得分時因跑壘不慎而扭傷右腳腳踝隨後立刻送至醫院進行核磁共振成像檢查確認右腳掌中間的蹠跗韌帶拉傷與右腳腓骨長肌肌腱撕裂傷需固定傷口休養周後才能開始復健由於復健期間的狀況並不理想使得王建民在年球季提前報銷雖然這季僅留下勝敗的成績不過部分美國媒體仍認定王建民球季投完的成績仍然可以達到年的水準年月日洋基球團和王建民達成協議年的薪資為年萬美元藉此避掉薪資仲裁在年球季卡斯坦查爾斯沙巴西亞柏奈特兩名著名投手加盟洋基後使得王建民從原本的王牌一號先發降為三號但由於王建民積極備戰及熱身賽的表現狀況理想很快就被教練團調升至二號先發期間王建民特別戴者繡上王字的新手套並馬上獲得沙巴西亞等隊友的關注同時王建民被選為球場看版球星之一並在月日春訓期間擔任新洋基球場首次啟用的先發投手以重視王建民過去對球隊的貢獻這次對上芝加哥小熊隊熱身賽中王建民主投局失分最後取得球場開幕後的勝投然而王建民年開季先後被金鶯光芒和印地安人打爆防禦率升高至以上後來在健康檢查中發現腰部有傷被安排至小聯盟進行復健賽調整並計畫最快至月日重回先發輪值不過直到月日王建民才再度登板並在對戰費城費城人擔任中繼投手接替先發投手柏奈特投球主投局被敲出支安打失掉分並有次三振重回大聯盟後雖然王建民的投球內容及成績有所回升但還是與受傷前有落差洋基再次為王安排檢查決定以復健方式來治療患部但進行相關醫療後王仍感覺傷勢未有太大進展年月日王建民出戰藍鳥時在第六局右肩拉傷下場經過診斷後確定是拉傷和黏液囊腫發炎為此總教練吉拉迪將王放入天傷兵名單後在取得洋基隊同意下王建民由經紀公司安排下至阿拉巴馬州接受運動醫學權威醫生詹姆斯安德魯斯英语 進一步的檢查認定王的傷勢為右肩關節囊的韌帶撕裂 隨後透過關節鏡手術進行肩關節囊韌帶損傷修補使得王的年球季宣告提前結束華盛頓國民编辑 年月已經加入華盛頓國民的王建民年月日紐約洋基隊於主場擊敗費城人隊取得第座大聯盟世界大賽冠軍但王建民因傷勢未復原而未參與世界大賽冠軍賽同年月日由於按大聯盟規章若與前年度於大聯盟登錄的球員換約至多僅能減薪洋基至少得付萬美元洋基擔心王建民傷後無法回復原有水準而決定選擇不換約使其提前成為沒有合約的自由球員雖然後續紐約洋基隊提出以小聯盟約續約等待養傷完成並接受測試後回到大聯盟並簽大聯盟合約然而由於王建民也可以選擇加入其他大聯盟的球隊其與經紀人艾倫尼洛 決定到自由市場探詢比洋基更合適的合約年月日王建民以一年萬美金加上激勵獎金萬美金的條件共計最高約萬美元的合約加入華盛頓國民月日雙方召開加盟記者會宣布正式簽約球衣號但在月日王建民因傷復健華盛頓國民隊官方網站正式宣佈無法趕上球季同年月日華盛頓國民隊公佈結果確定不執行和王建民的直接續約權王建民從月日開始正式成自由球員不過在隔年春訓前華盛頓國民隊以一年萬美金及激勵獎金再度網羅自月日經長期復健的王建民開始在小聯盟進行數場復健賽且讓國民隊評估重新回到大聯盟比賽中開季前被列入天傷兵名單年月日國民隊宣佈王建民重新回到大聯盟月日王建民重返美國職棒大聯盟先發出戰紐約大都會隊主投局失分分其中分是自責分雖然復出首戰即敗投第二次先發出戰勇士隊也未獲得勝投到了月日王建民在芝加哥客場第三次先發出戰小熊隊主投局被擊出支安打無失分協助華盛頓國民隊以比擊敗小熊隊拿下傷癒後及本季首場大聯盟勝投而在月日對決勇士隊主投六局失一分率領國民隊以擊敗勇士拿下本季第四勝同時敲出他大聯盟生涯的第一支安打和第一分打點年球季留下總計四勝三負防禦率的成績王建民在復出後的不錯表現也使國民隊決定再與其續約一年年月日對洋基熱身賽投局用了球球好球球速最快哩被打出支安打三振次保送次無失分於第局洋基隊第二棒羅素馬丁打出投手前滾地球王建民接到球直接往一壘衝要踩壘包時重心不穩摔跤跌倒左腿後肌肉拉傷此傷勢使他在開季時列入傷兵名單中月日國民隊對勇士隊的比賽王建民本季初登板中繼主投局失分拿下勝投不過在月日王建民因為先發表現不佳被調到牛棚擔任長中繼來調整控球的節奏月日被以右臀拉傷為由放進天傷兵名單牛棚空缺由亨利羅德裡格斯英语 接替月日重返大聯盟先發出戰密爾瓦基釀酒人主投局失分但由於國民守備失誤過多球隊最終仍以比輸球由於王建民在年的表現不如預期且多次受傷進入傷兵名單國民隊決定不再續約王建民再度成為自由球員多倫多藍鳥编辑 參加年世界棒球經典賽的王建民在不續約與發生緋聞的情況下王建民於該年季後決定返國投入經典賽國家隊希望藉由國際賽的好表現來尋求新合約年月日王建民代表中華隊在第三屆世界棒球經典賽首輪出戰澳洲隊主投六局無失分終場以比擊敗澳洲拿下勝投月日王建民在日本東京巨蛋主投經典賽複賽首場比賽對上日本隊主投六局無失分但中華隊終場比落敗王建民於當年度世界棒球經典賽預複賽合計投出局無失分的佳績優異的表現獲得美國日本多支球團的注意與洽詢最後在同年月日王建民選擇與個人投出生涯高峰的洋基隊簽下帶逃脫條款的小聯盟合約重回熟悉的環境月日王建民在小聯盟出賽然而洋基隊在開季後始終未將王建民升上大聯盟 年加入多倫多藍鳥的王建民擔任藍鳥隊的先發投手因為無法登上大聯盟王建民在月日決定行使逃脫權而解除與洋基的合約轉而與同屬美東球隊的多倫多藍鳥簽約於月日首次出場先發月日對遊騎兵主投局無失分獲得在藍鳥隊的首勝不過在同年月日對老虎投局失分退場被球隊指定派遣後下放小聯盟年月日王建民被叫上大聯盟對休斯頓太空人擔任先發主投局失五分吞敗投王建民再度被指定派遣回到水牛城野牛隊月日水牛城野牛隊頒發東山再起獎給王建民表彰他本季對野牛隊的貢獻月日根據合約王建民結束與多倫多藍鳥的合約成為自由球員王建民於本季在藍鳥隊升上大聯盟有過場先發出賽 王建民於藍鳥隊水牛城野牛擔任先發投手在之前已遭藍鳥隊指定轉讓而下放調整小聯盟出賽编辑年月日王建民與辛辛那提紅人簽定附有大聯盟春訓邀約的小聯盟合約小聯盟月薪萬美元登上大聯盟則為年薪萬美元上大聯盟後若再遭下放年薪則以萬美元計算此外附有激勵獎金以及逃脫條脫提供兩次逃脫機會年月日結束大聯盟春訓後被下放小聯盟球季開始後從小聯盟路易斯維爾蝙蝠英语 隊出發因為無法得到登上大聯盟的機會月日紅人隊宣布王建民選擇逃脫離開紅人隊年月日加入美國職棒芝加哥白襪隊所屬的小聯盟夏洛特騎士英语 隊背號為號年球季沒有升上大聯盟的機會總共場先發戰績勝敗防禦率年月日王建民與亞特蘭大勇士簽下小聯盟合約獲邀參加年大聯盟春訓球季開始後在谷內勇士英语 隊出賽但在年月日王建民被勇士隊釋出為旅美年生涯首次遭解約因無法獲得其他大聯盟球隊的合約月日王與美國大西洋獨立聯盟 藍蟹隊 簽約藉此延續旅美生涯王建民轉戰獨立聯盟後在獨立聯盟先發主投先發了場比賽並皆拿下勝投防禦率僅因此在年月日王建民與西雅圖水手隊簽下小聯盟合約投身小聯盟塔科瑪雨人隊再度重新回到大聯盟體系重回水手小聯盟體系並結束小聯盟球季後王建民仍未得到月擴編升上大聯盟之機會堪薩斯市皇家编辑年月王建民經過經紀人張嘉元介紹開始接觸德州棒球農場與其主人 於月正式展開為期週的改造訓練而在年球季結束後王建民再次成為自由球員 於年加入堪薩斯市皇家隊的王建民擔任皇家隊的後援投手年月日王建民與去年冠軍隊堪薩斯市皇家簽下小聯盟合約若上大聯盟基本薪萬美金最高激勵獎金可達年薪萬美金經過德州棒球農場的訓練改造後王建民於春訓期間球速明顯提升最快甚至可達最後於春訓出賽場場先發留下勝敗防禦率成績月日王建民在局上半達成本季大聯盟的初登板於領先時面對雙城以局安打保送三振的內容結束比賽月日前局打完以落後國民的皇家推出王建民在局上半登板投球以局三振的內容結束這個半局再靠著局下 的再見安打逆轉獲勝王建民相隔天再拿勝投月日皇家與老虎的比賽王建民以局無失分的成績拿下本季第四勝也正式達到生涯個勝負總和的門檻而他勝敗生涯勝率排在大聯盟史上的第名月日移出日傷兵名單並被球隊列入指定派遣當週釋出後再次成為自由球員本季成績為勝敗結算勝敗生涯勝率排在大聯盟史上的第名教練時期编辑年王建民於春訓時期擔任洋基隊小聯盟的客座教練同年月日於陳金鋒的牽線下在三周內擔任富邦悍將二軍客座投手教練同年月再度擔任此職務且長期協助訓練年受中華隊總教練洪一中之邀加入世界棒球強賽的中華隊教練團擔任牛棚教練一職年加入中信兄弟教練團擔任二軍客座投手教練球員分析编辑投球風格编辑身材高大的王建民以四分之三斜肩投球機制投球主戰的球路為伸卡球二縫線快速球與滑球另外則有四縫線快速球變速球指叉球等球路作為陪襯於全盛時期王最倚賴的伸卡球能穩定地投在~約~配比較少的四縫線速球約在~約~主力變化球滑球則約在~約~憑著出色的伸卡球威力王成為一名成功的滾地球型投手能有效降低打者擊出長打的機率以減少失分但其變化球品質相對不足所以王的三振能力在大聯盟中僅屬劣於平均的水準生涯為於年球季王有感於肩傷後復出的球速球威明顯不若以往因此於本身的實戰球路中再加上新練成的曲球作為搭配王建民的伸卡球採二縫線握法中指扣住縫線加壓以接近快速球的投球方式投出球路軌跡會朝左打者外角快速下沈再加上球速夠快讓打者不易掌握更能造成滾地球出局生涯最快球速曾達約從年球季開始逐漸增加使用量的滑球也以接近快速球的出手方式投出藉此擾亂打者讓打者難以預測或鎖定單一球路來揮擊使得王的配球自升上大聯盟後一慣的以伸卡球為主體演變成能視比賽當日的身體狀況予以調整王建民在球員生涯中的最快球速為年於小聯盟比賽中投出的約生涯數據编辑小聯盟投球成績年度所屬球隊等級出賽先發局數勝投敗投中繼救援完投完封保送三振被全壘打責失勝率防禦率紐約洋基短期紐約洋基短期 紐約洋基新人聯盟紐約洋基紐約洋基紐約洋基 紐約洋基紐約洋基高階紐約洋基華盛頓國民華盛頓國民高階華盛頓國民華盛頓國民 華盛頓國民華盛頓國民高階 華盛頓國民 華盛頓國民紐約洋基多倫多藍鳥 辛辛那提紅人 芝加哥白襪 亞特蘭大勇士 備註年開刀年新人聯盟及年為復健賽例行賽投球成績年度所屬球隊等級出賽先發局數勝投敗投中繼救援完投完封觸身保送三振被全壘打責失勝率防禦率紐約洋基 紐約洋基紐約洋基 紐約洋基紐約洋基華盛頓國民 華盛頓國民 多倫多藍鳥堪薩斯市皇家 例行賽打擊記錄年度所屬球隊等級出賽打數打點得分安打二壘打三壘打全壘打保送三振犧打盜壘長打率打擊率紐約洋基紐約洋基紐約洋基紐約洋基紐約洋基華盛頓國民華盛頓國民多倫多藍鳥堪薩斯市皇家季後賽投球記錄年度所屬球隊系列戰出賽先發局數勝投敗投中繼救援完投完封觸身保送三振被全壘打責失勝率防禦率紐約洋基 紐約洋基 紐約洋基 私人生活编辑王建民的配偶為吳嘉姈王建民赴美前即認識兩人於年亞錦賽後留台期間於同年月日於台南成婚婚後兩人仍赴美共同生活年月日約早上九時太太吳嘉姈於美國紐約產下長子王鵬硯 賈斯汀傑西王於出生孩子擁有美國公民與中華民國國民的雙重國籍而王建民也成為首位子女於大聯盟生涯期間誕生的台灣籍美國職棒大聯盟球員年月日次子王照升 誕生不過在年一向給人愛家好男人形象的王建民卻在開季後不久爆發外遇緋聞月日王建民搶在壹周刊同日出刊前在美國召開記者會坦承自己在年因為職業球員事業低潮而爆發一段婚外情這段關係維持約八個月這次事件也震驚許多球迷另外王建民因過去在美常受邀去參觀育幼院或看病童因此有成立基金會以資助弱勢兒童的計畫並於年月日成立小王子加油基金會個人成就编辑獲獎記錄编辑年獲得第九屆世界軟式少棒錦標賽最佳投手獎年獲行政院體育委員會頒發運動精英獎年度最佳男運動員年蟬聯行政院體育委員會頒發運動精英獎年度最佳男運動員年王建民以十九勝並列年度勝投王的優異表現獲頒總統表揚狀當日比賽前在洋基球場球團破天荒安排高規格表揚儀式在大型看板打出 台灣之子字樣由播報員宣讀表揚狀的內容王建民在全場數萬球迷歡呼聲中接受表揚年獲得美國職棒大聯盟官網的球迷票選為年度最佳先發投手 年中華民國教育部頒發一等教育文化獎章表彰王建民長期致力推展棒球運動乃教育部史上第十七位得主也是第一位以體育文化特殊貢獻獲獎者同時是目前所有得獎者中最年輕的年獲救國團頒發的民國九十六年青年獎章年以勝敗的成績獲球迷票選為四月份 百事可樂關鍵時刻球員 為台灣球員第一次獲得此獎年王建民當選第屆中華民國十大傑出青年其它榮譽编辑年獲美國運動畫刊雜誌評比為今年備受注目的二十位運動員之一年王建民在球隊時期的號球衣被球隊列為退休背號以紀念王建民在該球隊的貢獻為洋基第二個退休背號年出戰巴爾的摩金鶯隊獲得勝投以勝的成績締造大聯盟亞洲籍投手單季最多勝投與明尼蘇達雙城隊的左投友漢桑塔那並列該年度的大聯盟勝投王年王建民在洋基隊主場迎戰來訪的底特律老虎隊順利拿下勝投成為大聯盟亞洲第一位在季後賽取得勝投的投手年擔任第十六屆洲際盃代言人並獲邀擔任中華隊與古巴隊之戰的開球貴賓年入選該年度時代年度全球最具有影響力的百大人物之一成為台灣第三位得此殊榮的人年入選該年度時代年度全球最有影響力的百大人物之一是台灣唯一連續兩年皆入選的人年紀錄片後勁王建民是加拿大華裔導演陳惟揚 耗費約四年時間紀錄王建民在德州棒球農場練習並重返大聯盟的時期該片在年月獲得洛杉磯亞太影展觀眾票選最佳國際紀錄片獎入圍第屆金馬獎最佳紀錄片同年月在台灣上映另見编辑

There are different approaches to analyze text data in R. Here, I am using a tidy approach.

#tokenize your text data
bio_clean<-as.data.frame(bio_clean)
bio_clean<-bio_clean %>% rename(text = 1)
toks<-bio_clean %>%
 unnest_tokens(word, text) 

#find out those Chinese characters that occur more than 20 times in the wiki
toks%>%
 count(word, sort = TRUE) %>%
 filter(n > 20) %>%
 mutate(word = reorder(word, n)) %>%
 ggplot(aes(n, word)) +
 geom_col() +
 labs(y = NULL) +
 labs(x = "Frequency")

This is not ideal. Our plot is not able to display Chinese characters. We need showtext_auto() in showtext.

#load showtext
library(showtext)

#call showtext_auto()
showtext_auto()

#run the same code for plotting the text analysis
toks%>%
 count(word, sort = TRUE) %>%
 filter(n > 20) %>%
 mutate(word = reorder(word, n)) %>%
 ggplot(aes(n, word)) +
 geom_col() +
 labs(y = NULL) +
 labs(x = "Frequency")

Bingo!!

Shonn Cheng
Shonn Cheng
Assistant Professor at National Taipei University of Technology

Related