認識 Cookie

認識 Cookie 

前言

Cookie 是有些網站要辨識使用者身份所設定的資訊,例如 PPT 網站部分版面,有限制須年滿18歲才可以進入,此18歲的設定就是 cookie, cookie 基本上是以 "鍵:值",也就是字典格式配對存在。有時候 cookie 也是伺服器為了追蹤對話(Session)的物件,儲存在使用者電腦的數據。例如,購物網站可以將我們的購買訊息以 cookies 記錄起來,然後由此判斷我們的興趣,當作未來推薦產品之用。

PPT的 cookie 格式如下 :

cookie = {'over18':1}

有些網頁如果沒有登入使用者,是無法瀏覽的,成功登入網頁後伺服器會分配 cookie 給使用者,我們設計的爬蟲程式需帶著 cookie 才可以正常登入頁面。

範例 pythonCookie-01.py : 登入網頁需使用 Cookie ,同時列印出此 Cookie。

# pythonCookie-01.py
import requests

url = 'http://httpbin.org/cookies'
cookies = dict(key1='value1')
r = requests.get(url, cookies=cookies)
print(r.text)

執行結果

{
  "cookies": {
    "key1": "value1"
  }
}

參考資料

特色、摘要,Feature、Summary:

關鍵字、標籤,Keyword、Tag:

  • Web-Crawler,Data-Mining,Data-Science,htmlcss-web,

留言

這個網誌中的熱門文章

Ubuntu 常用指令、分類與簡介

網路設定必要參數IP、netmask(遮罩)、Gateway(閘道)、DNS

iptables的觀念與使用

了解、分析登錄檔 - log

Python 與SQLite 資料庫

Blogger文章排版範本

Pandas 模組

如何撰寫Shell Script

查詢指令或設定 -Linux 線上手冊 - man

網路相關之指令