速看(java工程導(dǎo)出)java導(dǎo)出的項目用什么打開,一種使用Java的快速將Web中表格轉(zhuǎn)換成Excel的方法,1k是多少錢,
目錄:
1.java導(dǎo)出工程文件
2.java導(dǎo)出功能
3.導(dǎo)出javadoc
4.java導(dǎo)出項目包
5.java導(dǎo)入導(dǎo)出用什么
6.java 導(dǎo)出設(shè)置導(dǎo)出的路徑
7.java導(dǎo)出可運行的jar文件
8.java導(dǎo)出功能實現(xiàn)
9.java導(dǎo)出程序
10.java工程如何導(dǎo)出
1.java導(dǎo)出工程文件
背景隨著后疫情時代的到來,在過去的2022年,全國的經(jīng)濟(jì)情況,想必是很多學(xué)者和研究對象都非常關(guān)心的事而這些數(shù)據(jù)在國家統(tǒng)計局網(wǎng)站上都有相應(yīng)的記錄通過分析這些數(shù)據(jù),可以從某一個角度來驗證和觀察當(dāng)下的經(jīng)濟(jì)情況。
2.java導(dǎo)出功能
全國共計有1279個縣級單位已經(jīng)披露了2022年GDP和一般公共預(yù)算收入數(shù)據(jù)情況,企業(yè)預(yù)警通根據(jù)標(biāo)準(zhǔn)貝斯有幾根弦這些數(shù)據(jù)整理出中國百強(qiáng)縣gdp排行榜和百強(qiáng)縣一般公共預(yù)算收入排行榜其中昆山市以5006.66億元GDP蟬聯(lián)榜單榜首,江陰市、晉江市位列百強(qiáng)縣第二三位,長沙縣是湖南省唯一進(jìn)入全國前十的(Top7)。
3.導(dǎo)出javadoc
來源:2023中國縣城GDP百強(qiáng)榜揭曉 2023中國百強(qiáng)縣排行榜一覽
4.java導(dǎo)出項目包
第一張圖是以圖片的形式發(fā)布的,第二種是采用Html的表格(table)形式展示的在離線分析使用數(shù)據(jù)的時候非常不方便作為程序猿,這一定難不倒您我們可以采用網(wǎng)頁抓取的技術(shù)對數(shù)據(jù)進(jìn)行整理本文將以Java語言為編程語言,講解使用Jsoup對Web網(wǎng)頁知識進(jìn)行爬取,文中給出了詳細(xì)的示例代碼,希望對大家標(biāo)準(zhǔn)貝斯有幾根弦有幫助。
5.java導(dǎo)入導(dǎo)出用什么
一、初識Jsoup抓取1、網(wǎng)頁結(jié)構(gòu)分析在使用Jsoup對頁面進(jìn)行抓取時,需要對網(wǎng)頁的結(jié)構(gòu)進(jìn)行初步的分析,便于制定相對應(yīng)的抓取策略首先打開瀏覽器,輸入目標(biāo)網(wǎng)站的地址,同時打開F12進(jìn)入調(diào)試,找到目標(biāo)網(wǎng)頁的元素。
6.java 導(dǎo)出設(shè)置導(dǎo)出的路徑
打開上面gdp百強(qiáng)榜表格中的div下table表格,找到如下的數(shù)據(jù)
7.java導(dǎo)出可運行的jar文件
同理,對于一般公共預(yù)算收入的數(shù)據(jù)處理也是同樣的處理辦法,在此不再贅述二、Java開發(fā)Jsoup抓取1、引用Jsoup相關(guān)依賴包這里我們采用Maven的jar進(jìn)行包的依賴處理管理因此先定義Pom.xml,關(guān)鍵代碼如下所示:。
8.標(biāo)準(zhǔn)貝斯有幾根弦java導(dǎo)出功能實現(xiàn)
2、信息實體類的處理對比發(fā)現(xiàn)兩個表格處理具體的指標(biāo)不一樣,前面的排名和縣名稱,所在省份名稱都是一樣的。因此我們采用面向?qū)ο蟮脑O(shè)計方法對信息處理的類進(jìn)行開發(fā)。相應(yīng)的類圖如下所示:
9.java導(dǎo)出程序
3、數(shù)據(jù)采集實體
10.java工程如何導(dǎo)出
在上面的代碼中,將排序、縣級地區(qū)、省作為父類抽象出來,設(shè)計兩個子類:GDP類和一般公共收入類這里需要注意的是,由于這里我們需要將采集的數(shù)據(jù)保存到本地的Excel表格中,這里我們采用EasyExcel作為技術(shù)生成組件。
@ExcelProperty這個屬性中,我們定義了寫入的Excel表頭以及具體的排序
4、實際爬取下面是處理GDP數(shù)據(jù)的轉(zhuǎn)換代碼標(biāo)準(zhǔn)貝斯有幾根弦,如果不熟悉Jsoup可以先熟悉下相關(guān)語法,如果有類似Jquery的開發(fā)經(jīng)驗,對于Jsoup上手非常快。
這里需要注意的是在jsoup中如何進(jìn)行網(wǎng)頁的元素定位及抓取。在上面這里,我們使用類似jquery的Dom獲取方法。
通過這一行去獲取表格下的每一個tr,然后再循環(huán)每個td就可以獲取對應(yīng)的數(shù)據(jù) 三、過程分析及結(jié)果1、采集過程分析這里采用對源程序進(jìn)行debug的方法對網(wǎng)頁進(jìn)行抽絲剝繭的分析使用jsou進(jìn)行網(wǎng)頁模擬訪問
采用select(xxx)的方法獲取頁面元素,
獲取tr下的td單元格數(shù)據(jù),
2、運行結(jié)果上述代碼運行完成后,在目的磁盤可以看到以下兩個文件,
打開上述兩個excel文件可以看到想要采集的數(shù)標(biāo)準(zhǔn)貝斯有幾根弦據(jù)已經(jīng)采集完畢,數(shù)據(jù)的順序也是完全按照網(wǎng)頁上的順序來進(jìn)行生成的。
總結(jié)以上就是本文的主要內(nèi)容本文將以Java語言為編程語言,詳細(xì)講解了如何使用Jsoup對Web網(wǎng)頁知識進(jìn)行爬取,結(jié)合EasyExcel將網(wǎng)頁表格轉(zhuǎn)換成Excel表格,同時文中給出了詳細(xì)的示例代碼由于行文倉促,難免有誤,歡迎批評指正交流。
————————————————版權(quán)聲明:本文為CSDN博主「夜郎king」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明原文鏈接:https://blog.csdn.net/yelangkingwuzuhu/article/details/130901172。