Yahoo奇摩 網頁搜尋

  1. 約 16,300,000 項搜尋結果

  1. 2015/6/10 · 這個惡意代碼本質是圖片的代碼和 Javascript 腳本的混合,被稱之為 IMAJS。駭客可以把代碼寫進 JPG 或者 PNG 格式的圖片中,除非把圖片放大仔細查看,否者一般情況下,肉眼很難發現圖片有問題。 駭客在圖片中寫了惡意程式,這個程式可以設計很 ...

    • Html 標籤基礎知識
    • 網絡抓取規則
    • 查看頁面
    • 學習代碼
    • 導出 Excel Csv 格式數據
    • 更進一步(高級用法)
    • 高級抓取技術
    • 採取「別重複」方法:Dry

    如果你已經充分理解 HTML 標籤,請跳過這一部分。這是 HTML 網頁的基本語法。 每一對 標籤內包含網頁的一段代碼: 1. : HTML 文件必須以文件類型聲明開頭 2. HTML 文件包含在 和 標籤之間 3. 元(meta)和腳本(script)聲明包含在 和 標籤之間 4. 網站上可見的部分包含在 和 標籤之間 5. 和 標籤之間的部分為網站標題 6. 標籤用於定義段落 其他有用的標籤還有: 是超鏈接的標籤, 是表格的標籤, 是表格行的標籤, 是表格列的標籤。 並且,HTML 標籤常常帶有標識碼(id) 或類(class)屬性,...

    1.在您進行網絡抓取時,你應該查看網站的條款和條件。請仔細閱讀數據合法使用聲明。通常情況下,您抓取的數據不能商用。 2.您的程序不要過於頻繁的向網站發出數據請求(也被稱為垃圾請求),這種做法可能會使網站崩潰。請確保您的程序行為合理(也就是說和人類的行為相似)。對一個網站每秒進行一次數據請求是比較好的做法。 3. 網站的佈局隨時間不斷變化,所以請您確保時常重新訪問網站,如果需要的話,修改抓取代碼。

    讓我們以 Bloomberg Quote 網站的其中一頁為例。 作為一個關注股票市場的投資人,我們想要從這一頁得到股指名稱(標準普爾 500 指數)和價格。首先,右鍵點擊打開瀏覽器的檢查器(inspector),查看網頁。 請嘗試把光標放在股指價格上,你應該可以看到價格周圍的藍色方塊,如果你點擊這個方塊,就可以選中瀏覽器控制台相應的 HTML 代碼。 從結果可以看出,價格信息包含在好幾層 HTML 標籤中: 同樣的,如果你把光標放在名稱「標準普爾指數」上,並點擊,可以看到控制台裡這個信息包含在標籤< iv class=”basic-quote”>及< h1 class=”name”>之內。 現在我們知道如何依靠類標籤找到我們需要的數據了。

    現在我們知道所需數據的位置,我們可以開始寫代碼構建我們的網絡爬蟲了。現在請打開您的文字編輯工具! 首先我們要導入我們要用的各種庫。 # 導入各種庫 然後,我們定義一個變量(quote_page)並賦值為網站的網址鏈接。 # 賦值網站鏈接 接著,利用 Python 的 urllib2 庫獲取方才定義的網址 quote_page 的 HTML 網頁信息。 # 檢索網站並獲取 html 代碼,存入變量”page”中 最後,我們把網頁解析為 BeautifulSoup 格式,以便我們用 BeautifulSoup 庫來分析網頁。 # 用beautifulSoup 解析HTML代碼並存入變量“soup”中` 現在我們有了包含整個網頁的 HTML 代碼的變量 soup。我們就從 soup 開始著手提取信...

    我們已經學會如何獲取數據,現在來學習如何存儲數據了。Excel 逗號隔開的數據格式(CSV)不失為一個好選擇。這樣我們就可以在 Excel 中打開數據文件進行查看和進一步處理。 在此之前,我們需要導入 Python 的 csv 模塊和 datetime 模塊。Datetime 模塊用於獲取數據記錄時間。請將下面幾行代碼插入您的導入代碼部分。 在您代碼的最下方,加上把數據寫入 CSV 文件的代碼。 # 以「添加」模式打開一個 csv 文件,以保證文件原有信息不被覆蓋 with open(‘index.csv’, ‘a’) as csv_file: writer = csv.writer(csv_file) writer.writerow([name, price, datetime.now()...

    抓取一個股指信息對您來說不夠,對嗎?我們可以試試同時提取多個股指信息。首先,我們需要修改 quote_page,把它定義為網址的數組。 然後我們把數據提取部分代碼改成一個 for 循環。這個循環可以一一處理網址,並以元組(tuple)類型把所有數據存入變量 data. # for 循環 # 檢索網站並返回HTML代碼,存入變量’page’ # 用 beautifulSoup 解析 HTML 代碼並存入變量`soup` # 獲取“名稱”類的 代碼段落並提取相應值 # 獲取股指價格數據 # 用元組類型存儲數據 並且,修改保存部分以便一行行保存數據 # 以“添加”模式打開一個 csv 文件,以保證文件原有信息不被覆蓋 # for 循環 重新運行程序,您應該可以同時提取兩個股指價格信息了!

    BeautifulSoup 庫使用簡單,能很好的完成小量的網站抓取。但是如果您對大量的抓取信息感興趣,您可以考慮其他方法: 1. 強大的 Python 數據抓取框架 Scrapy。 2. 您可以試試把一些公共應用程序接口(Application programming interface, API)整合入您的代碼。這個獲取數據的方法遠比網頁抓取高效。舉個例子來說,您可以試試 Facebook Graph API,這個應用程序接口可以幫助您獲取臉書網站上不顯示的隱藏信息。 3. 如果數據量過大,您可以考慮使用類似 MySQL 的數據庫後端來存儲數據。

    DRY 是「別重複你做過的事」的英文簡寫。 您可以嘗試像鏈接中的這個人一樣把日常的工作自動化。同時您還可以考慮其他有趣的項目,比如說掌握您的臉書好友的上線時間(當然在徵得他們同意的情況下),或者獲取某個論壇的講座主題列表來嘗試自然語言處理(這是目前人工智能的熱門話題)! —— (本文經 大數據文摘微信公眾平台(ID:BigDataDigest) 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈手把手| 範例+代碼:一文帶你上手Python網頁抓取神器BeautifulSoup庫〉,原文鏈接 ,首圖來源:Marcus Brown, CC Licensed。)

  2. 2019/4/22 · 下述是我上文演算法的偽代碼: 這樣寫就更像真實代碼了: 偽代碼和真實代碼的相似度取決於你,通過長期實踐你會找到最適合你的一種形式。 第四步,嘗試將程式碼全面化 提示:如果問題比較簡單,你也可以一併完成上述步驟 這下我們需要開始考慮語法、函數參數及語言規範了。 你或許不能一下就把代碼寫的很全面,沒關係,先寫下你會的。 你會發現上述代碼中我留空了一部分。 我是故意的,因為我不確定在JavaScript語言中給字串切片的語法,所以我會在下一步中查詢該語法。 第五步,杜絕來源不明的片段程式碼 我發現新手工程師常犯這樣一個錯誤,就是在網上找到一些覺得可能有用語句,不經測試便將其加到程式中。 你不理解的程式碼片段越多,就越不可能找到適合的解決方案。

    • 支援 23 種程式語言,依照 Coding 習慣給出建議
    • 5 種編輯器安裝懶人包
    • 一分鐘內省下一秒鐘,不滿意 30 天內能退款
    • 神器來自 OpenAI 的架構
    • 具備「自動補完」後續程式碼功能
    • 工程師網友狂讚!直稱:「殺手級應用」
    • 作者是一位大四學霸
    • 傳送門

    Deep TabNine 支持 Java: Python: C++: Haskell: 不同於各種其他程式碼補全外掛,Deep TabNine 是根據工程師過去的習慣自動補全,並在後面給出幾種選項的概率。 如果有類似程式碼出現在之前的項目里,TabNine 還會在補全候選框中直接給出地址,方便用戶點擊進去查閱。 除以上幾種語言之外,Deep TabNine 還支持 JavaScript、C、PHP、Go、C#、Ruby、Objective-C、Rust、Swift、TypeScript、OCaml、Scala、Kotlin、Perl、SQL、HTML、CSS 和 Bash。 主流程式語言幾乎都囊括在內。

    TabNine 支持 VS Code、Sublime Text、Atom、Emacs、Vim 五種程式碼編輯器。 對於使用 VS Code 和 Sublime 來說,安裝 TabNine 非常方便,用自帶的擴展包管理工具即可。 VS Code VS Code 用戶按 下Ctrl+P(Mac用戶按下⌘+P),黏貼以下命令,然後按 Enter 完成安裝。 Sublime Sublime 用戶安裝分為兩步: 1、按下 Ctrl+Shift+P(Mac 用戶:⌘+Shift+P),選擇 Install Package Control; 2、再次按下 Ctrl+Shift+P(Mac 用戶:⌘+Shift+P),選擇 Package Control:Install Package,然後選擇 TabNi...

    項目超過 400kb 需要購買許可證:個人用戶 49 美元(約 1,470 台幣),商業用戶 99 美元(約 2,970 台幣)。 由於 Deep TabNine 用到機器學習補全程式碼,因此需要大量的算力(超過 100 億次浮點運算),在筆記本上運行模型,無法獲得低延遲的體驗。 因此,軟體開發者推出了 TabNine Cloud 雲服務器,用雲端 GPU 加速。付費用戶不需要再加錢即可使用。 所以聽起來很划算吧? 軟體開發者自己就說,這個價格其實不貴,有了 TabNine,一分鐘裡能幫你節省一秒,咱們再算算工程師的時薪,每個小時能節約 1.4 美元,不到一年時間就能回本了。 如果你對效果不滿意,TabNine 開發者還提供 30 天退款保證。

    TabNine 是在 GPT-2 的基礎上構建的,這是一種 Transformer 架構,原產自 OpenAI,是個「逆天」語言模型。 GPT-2 的參數高達 15 億個,數據量比一代擴大了 10 倍,使用了包含 800 萬個網頁的數據集,共有 40GB。 逆天之處就在於,GPT-2 寫起文章來毫無違和感,無需針對性訓練就能橫掃各種特定領域的語言建模任務,還具備閱讀理解、問答、生成文章摘要、翻譯等等能力。 就 GPT-2 而言,它的訓練目標很簡單:根據所有給定文本中前面的單詞,預測下一個單詞。雖然本來是解決 NLP 問題,看似與寫程式碼沒什麼關聯,但建模程式碼也算是用一種獨有的方式在理解英文。 比如,可以讓模型用 if/else 語句否定單詞:

    項目主頁顯示,在大約經過 GitHub 中 200 萬個文件訓練後,TabNine 具備了自動補全程式碼的能力。 在訓練這個模型期間,模型學習了例如動態類型語言中的類型推斷等複雜行為,用這樣的訓練方式預測 token。 作者表示,TabNine 可以很好利用傳統程式碼補全工具難以獲取的瑣碎細節。 例如,假設 app.get_user() 的返回類型是一個帶有 setter 方法的對象,而 app.get_users() 的返回類型是一個列表,兩個名稱之間只有細微的差別: 這個模型還能以自然語言編寫的文檔來推斷函數名稱、參數和返回類型: Deep TabNine 加入了之前用戶強烈要求加入的功能:用預先存在的知識,解決在創建新項目時的程式碼補全問題。 例如,它知道當一個類擴展 React.Co...

    TabNine 問世後,不斷收穫好評,甚至還有工程師激動得爆粗口: 臥槽,這種軟體多來點就好了。(Fuck yeah. This is the sort of software I want to see more often: TabNine ) 有網友表示, 沒有它都不知道該怎麼面對寫程式碼這件事了。 還有人稱之為開發者應用中的第一個「殺手級應用程序」: 「令人印象深刻」、「感到神奇」「太酷了」……推特上的評價,頗有電視廣告上「用了都說好」的畫風。 在各大科技論壇上,也有網友提出了建議和改進的方向。 有用戶反映,也有美中不足的地方,比如這個工具會干擾自動括號完成。 作者表示,TabNine 還在不斷更新完善中,正在改進這些 bug。

    想不到吧,這款好評如潮的程式碼工具,出自一名大四學生之手。 Jacob Jackson,加拿大人,目前在滑鐵盧大學主修電腦科學與組合優化專業,輔修數學。大四在讀,今年 8 月份畢業。 Jackson 此前在 Reddit 上發文稱,這是自己在大學階段開發的第一款商業軟體產品。 但 Jackson 並非無名之輩,年少有為,曾在 2014 和 2015 連續兩年獲得 IOI金 牌。 因此,大學一入學,便成為加拿大 Michael and Ophelia Lazaridis Olympiad Scholarship 獎學金的獲得者,免除了 8 個學期學費書費和生活費。 除了自動補全程式碼的 TabNine,Jackson 還開發了很多有意思的應用,比如一個名為 jellies 的益智遊戲,和使用蒙...

    TabNine 網站 Jackson GitHub Jackson 履歷 (本文經 AI 新媒體 量子位 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為 〈杀手级AI补代码工具问世,支持23种语言及5种主流编辑器,程序员沸腾了〉,首圖來源:Pxhere, CC Licensed。)

  3. 2017/12/11 · Colordot & Colourcode. Colordot 和 Colourcode 這兩個網站其實大致一樣,都是用戶在網頁區域內隨意移動鼠標來生產色卡,在不斷生成的色卡的同時用戶可以產生自己靈感,看看能不能隨機出一個自己滿意的配色。. 對於已經生成的色卡,你可以點擊刪除或者對它的色值 ...

  4. 2016/2/26 · 有很多次你更新了一丁點代碼,卻導致了整個程式崩潰出錯,完全停止了工作。 恢復到最近可工作的複製檔,然後從那裡開始一步步前進。 「只是忘記了一個分號,然而整個程式卻因此而轟然倒下」 幾乎所有我使用的程式設計語言都需要結束符。 雖然不是所有的語言都有,但在 C/C ++ 中是很常見的。 忘記添加結束符,不過是一個很顯然的錯誤! 但是解析器不知道這一點,它會拋出一個致命錯誤。 於是,你不得不額外花 20 分鐘去搜索技術故障,而原本只需要用 1 秒鐘補上那個缺少的分號即可。 嗯,這就是調試軟體的樂趣。 「我不知道讓別人來修復我的代碼,得花多少錢? 」 聘請另一個開發人員的點子是挺誘人的,但從財政上看顯然沒有那麼可行。 而且如果你不親身體驗的話,又怎麼能從這些錯誤中學到東西呢?

  5. 2017/8/4 · 實用 Win 組合鍵整理: 值得一提的是,「Win + 數字鍵」打開任務欄中的第 x 個程序,如 Win + 1 即可打開任務欄中第一個程序。 這是連 macOS 都沒有的快捷鍵,切換程序十分方便。 Fn 鍵 Fn 鍵是 Function(功能)的意思,它是筆記本電腦鍵盤中的組合性功能鍵,除了用於調節相應硬件設置,還有一些比較實用的功能。 • F2:對文件夾進行重命名; • F3:搜索,有時候比 Ctrl + F 還好用; • F5:刷新頁面,無論是桌面、文件夾、網頁均可。 更多關於 Fn 鍵的介紹可以參考下圖: Home、End 使用兩個鍵的人並不多,很少人會發現在編輯文檔時,按 Home 可以回到該行的行首,按 End 則到達該行的行末。

  1. 其他人也搜尋了