收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
關(guān)注已取消
關(guān)注成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{ !collectStatus ? '+' : '' }} {{!collectStatus ? '關(guān)注' : '已關(guān)注'}}
預(yù)約咨詢(xún)
收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學(xué) Journey 2022年06月22日 閱讀量:1917
<p style="text-align: justify;"><strong>學(xué)員背景</strong><br />F同學(xué)<br /><strong>本科背景</strong><br />廣東財(cái)經(jīng)大學(xué) 應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)<br />GPA 81.1 雅思7<br />指南者商業(yè)分析項(xiàng)目實(shí)戰(zhàn)學(xué)員<br /><strong>錄取學(xué)校(2022年秋季入學(xué))</strong><br /><a href="http://m.walkingbarcodes.com/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(xué)(QS排名78) 應(yīng)用統(tǒng)計(jì)學(xué)專(zhuān)業(yè)</span></a><br /><strong>背提戰(zhàn)績(jī)</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">距離項(xiàng)目結(jié)束已經(jīng)過(guò)去兩個(gè)月了,當(dāng)時(shí)參加這個(gè)項(xiàng)目的情形還歷歷在目。我是在今年1月初的時(shí)候報(bào)名這個(gè)項(xiàng)目的,其實(shí)當(dāng)時(shí)最擔(dān)心的問(wèn)題是這個(gè)項(xiàng)目會(huì)不會(huì)很水,因?yàn)榫W(wǎng)絡(luò)上一直詬病于這些項(xiàng)目,但當(dāng)我真正參與到課程中去的時(shí)候,我發(fā)現(xiàn)我的想法是錯(cuò)誤的。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">項(xiàng)目中很多地方對(duì)我影響很大,當(dāng)然我也受益其中,這個(gè)項(xiàng)目強(qiáng)化了我的專(zhuān)業(yè)技能(提前學(xué)習(xí)數(shù)據(jù)分析和挖掘建模方面的技能),豐富了我的實(shí)踐經(jīng)歷,對(duì)我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">01 背景與契機(jī)</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">一開(kāi)始選擇參加指南者的背景提升項(xiàng)目,是因?yàn)橛X(jué)得自己的項(xiàng)目經(jīng)歷太少再加上自己是雙非學(xué)校的背景,缺少具體的實(shí)戰(zhàn)經(jīng)驗(yàn),大學(xué)里參加的項(xiàng)目也很少。即使我是應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè),在學(xué)校里學(xué)了R語(yǔ)言和SQL,但是<strong>Python的實(shí)際應(yīng)用一直是我的弱點(diǎn)</strong>,所以基于這個(gè)想法,我想?yún)⒓右粋€(gè)提升個(gè)人編程能力的項(xiàng)目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">考慮到我后期我想申請(qǐng)港校和英國(guó)商業(yè)分析的方向,擁有相關(guān)的背景經(jīng)歷也是非常有必要的,<strong>國(guó)外的學(xué)校在BA這塊的錄取會(huì)特別注重申請(qǐng)者的數(shù)據(jù)分析和建模能力以及實(shí)踐經(jīng)驗(yàn)</strong>,這些都是我當(dāng)時(shí)比較缺少的幾點(diǎn)吧。包括我直系的師兄師姐和顧問(wèn)老師也跟我說(shuō)擁有幾段與碩士項(xiàng)目相似的經(jīng)歷會(huì)大大提高成功的概率,因?yàn)槟荏w現(xiàn)出自身與項(xiàng)目的匹配度。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">同時(shí)我未來(lái)的就業(yè)方向也是想往數(shù)據(jù)分析和商業(yè)分析這兩個(gè)方向,所以提前了解這個(gè)領(lǐng)域所必備的技能對(duì)以后就業(yè)或找實(shí)習(xí)都會(huì)有一定的好處?;谶@幾點(diǎn),我決定參加這個(gè)項(xiàng)目提升自己的背景與能力,最終收獲滿(mǎn)滿(mǎn)。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">02 項(xiàng)目介紹</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我參加的這個(gè)項(xiàng)目的名字叫做基于電商大數(shù)據(jù)零食市場(chǎng)的分析,這個(gè)項(xiàng)目主要是收集各類(lèi)淘寶村的店鋪數(shù)據(jù)和商品價(jià)格、銷(xiāo)量和人氣等數(shù)據(jù),以可視化和挖掘建模的方式解讀農(nóng)村淘寶的經(jīng)濟(jì)特征,從商品特色、品質(zhì)和口碑等方面,共同探究淘寶村如何實(shí)現(xiàn)興農(nóng)扶貧的目標(biāo)。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">本次項(xiàng)目的授課老師&mdash;&mdash;王老師,他在bilibili平臺(tái)的Tableau可視化視頻幾年來(lái)穩(wěn)居第一,而且他本人也曾經(jīng)在世界知名的咨詢(xún)公司工作過(guò)很多年,能夠真正給到我一些很實(shí)用的建議,所以個(gè)人覺(jué)得同學(xué)們完全可以大膽去報(bào)名這個(gè)項(xiàng)目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">關(guān)于學(xué)習(xí)的內(nèi)容,總共分為六大節(jié),上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎(chǔ)、pandas、多分類(lèi)問(wèn)題、語(yǔ)義情感分析、預(yù)測(cè)與相關(guān)因素分析,最牛的莫過(guò)于是利用百度智能云進(jìn)行語(yǔ)句情感得分分析,直接調(diào)用一段代碼就可以了,大大減少了代碼的書(shū)寫(xiě)時(shí)間提高了效率,關(guān)鍵<strong>這是我從來(lái)沒(méi)有在學(xué)校的一門(mén)課程里接觸到類(lèi)似的知識(shí)</strong>,我認(rèn)為這也是項(xiàng)目中的一個(gè)亮點(diǎn)之一,緊跟現(xiàn)在人工智能的一個(gè)潮流。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">03 準(zhǔn)備過(guò)程</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">即使我是學(xué)統(tǒng)計(jì)專(zhuān)業(yè),但在實(shí)際的操作中也會(huì)遇到不少&ldquo;困難&rdquo;,有一些是十分低級(jí)的錯(cuò)誤,比如使用jupyter notebook的時(shí)候把小窗口直接關(guān)掉,導(dǎo)致了程序無(wú)法正常運(yùn)行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個(gè)項(xiàng)目里需要每周一次作業(yè),來(lái)檢查同學(xué)們的聽(tīng)課情況,因?yàn)楫?dāng)時(shí)在寫(xiě)畢業(yè)設(shè)計(jì),時(shí)間分配和把控上做得不是很好,沒(méi)怎么認(rèn)真聽(tīng)課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒(méi)想到當(dāng)中遇到不少問(wèn)題,在群上詢(xún)問(wèn)老師意見(jiàn),一下子就被老師發(fā)現(xiàn)了,老師很?chē)?yán)厲地批評(píng)了我,并語(yǔ)重心長(zhǎng)地對(duì)我說(shuō):<strong>編程是需要時(shí)間去練習(xí)的</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">從那時(shí)開(kāi)始,我每周的課都聽(tīng)三遍,并將代碼自己再運(yùn)行一遍,務(wù)必讓自己每一個(gè)知識(shí)點(diǎn)都掌握好,這樣操作下來(lái)感覺(jué)就沒(méi)有特別大的問(wèn)題了,因?yàn)楹芏嚯y點(diǎn)都是老師所設(shè)計(jì)好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習(xí)編程,提高個(gè)人的編程能力,比如在??途W(wǎng)、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業(yè)做好充分的準(zhǔn)備</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">04 項(xiàng)目實(shí)戰(zhàn)</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">經(jīng)過(guò)一個(gè)多月的學(xué)習(xí)之后,我對(duì)Python和SQL已經(jīng)掌握得差不多了,在課程的最后就是需要進(jìn)行項(xiàng)目實(shí)操。個(gè)人猜測(cè),老師應(yīng)該運(yùn)用了web scraper插件在天貓上爬取了近3000多條數(shù)據(jù)以及商品的評(píng)論區(qū)的數(shù)據(jù),我們參加項(xiàng)目的同學(xué)進(jìn)行后續(xù)的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">首先基本操作,先導(dǎo)入numpy和pandas包,然后對(duì)excel表格里的數(shù)據(jù)進(jìn)行處理,因?yàn)檎G闆r下獲取的數(shù)據(jù)都是會(huì)有異常值與缺失值,所以我依照老師在課程上講過(guò)的處理方法,利用pandas庫(kù)對(duì)二維數(shù)據(jù)表對(duì)空白值去除填充,并且定義新函數(shù)對(duì)發(fā)貨地址的省份與城市實(shí)現(xiàn)Excel中的分列功能,最后運(yùn)用數(shù)組與集合等知識(shí)來(lái)對(duì)列中不規(guī)則的信息有效提取出來(lái),以獲得商品的具體分類(lèi)。在這個(gè)過(guò)程中,老師還經(jīng)常提醒我們要定期對(duì)表內(nèi)的信息進(jìn)行檢查,不然會(huì)影響到后續(xù)的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個(gè)項(xiàng)目中最精彩的部分估計(jì)就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開(kāi)始沒(méi)有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷(xiāo)量分析、單品分析,并且利用詞云wordart 做出評(píng)論區(qū)頻次最高的詞匯,消費(fèi)者對(duì)產(chǎn)品的態(tài)度一目了然。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">當(dāng)然這些僅僅停留在描述統(tǒng)計(jì)的范疇里面,是經(jīng)不起考驗(yàn)的。后面我們需要借助統(tǒng)計(jì)模型建立多元線(xiàn)性回歸模型和PCA模型,利用相關(guān)理論進(jìn)行必要的降維,導(dǎo)入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關(guān)性通過(guò)顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統(tǒng)</strong>對(duì)商品評(píng)論內(nèi)容進(jìn)行分析,這一步的操作行云流水,十分體現(xiàn)技術(shù),因?yàn)樵趯?shí)際處理中,用戶(hù)會(huì)輸入很多表情,這些都屬于異常字符,都需要進(jìn)行過(guò)濾,所以老師介紹了try&hellip;except&hellip;的解決方案,完美避開(kāi)了表情包的干擾,這樣能使工具能夠順利進(jìn)行,最后計(jì)算出同一產(chǎn)品的中位數(shù),并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶(hù)的情感得分分布,對(duì)后續(xù)的商家的運(yùn)營(yíng)策略調(diào)整具有積極性意義。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">05 個(gè)人感受</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我之前一直覺(jué)得SQL和Python在實(shí)際工作用到的情況十分少,我本人對(duì)我自己的Excel水平十分自信,覺(jué)得Excel應(yīng)該可以處理大部分?jǐn)?shù)據(jù)分析的問(wèn)題了,Python就是算法和爬蟲(chóng)工程師需要做的事。但是面對(duì)十分大的數(shù)據(jù)量的時(shí)候,上萬(wàn)條數(shù)據(jù)的時(shí)候Excel就可以不管用了,可以說(shuō)是內(nèi)存不夠,Python和SQL則可以改善這些缺點(diǎn),在電腦里相當(dāng)于是建立了一個(gè)虛擬內(nèi)存,處理數(shù)據(jù)起來(lái)就會(huì)十分快捷,這也是<strong>Excel無(wú)法達(dá)到的高度</strong>,所以<strong>如果以后要吃數(shù)據(jù)分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。</strong></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">目前我拿到了南安普頓大學(xué)應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)的offer,很感謝這個(gè)項(xiàng)目給予我的幫助,也增強(qiáng)了我對(duì)數(shù)據(jù)分析技能的信心,當(dāng)然想要成功,單靠這個(gè)課程是不夠的,還需要自身在日常生活中不斷耕耘,在實(shí)際數(shù)據(jù)分析操作中不斷查缺補(bǔ)漏,老師說(shuō)的話(huà)和這股信念鼓勵(lì)著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
預(yù)約咨詢(xún)
預(yù)約咨詢(xún)
微信咨詢(xún)
掃一掃立即咨詢(xún)
App下載
下載指南者留學(xué)App
預(yù)約咨詢(xún)
電話(huà)咨詢(xún)
400-183-1832
回到頂部
預(yù)約咨詢(xún)
現(xiàn)在來(lái)設(shè)置你的賬號(hào)吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請(qǐng)學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱(chēng)是
沒(méi)有查詢(xún)到相關(guān)的學(xué)校
查詢(xún)中...
3.3 您的專(zhuān)業(yè)名稱(chēng)是
沒(méi)有查詢(xún)到相關(guān)的專(zhuān)業(yè)
查詢(xún)中...
4. 您從哪里了解到指南者留學(xué)網(wǎng)站的
* 0/20
取消
您的會(huì)員等級(jí)不足,查看等級(jí)詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認(rèn)
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認(rèn)收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定