以下的資料是 2014 PIXNET Hackathon 活動中開放的資料集。詳細的資料說明與授權如下。
資料使用授權
若您下載下方連結所提供的資料集 (Dataset),表示您同意以下的資料使用授權:
您可以:
您必須:
您不可以:
如您利用提供的資料集,開發任何妨礙善良風俗之違法服務或程式工具,PIXNET 並不為此負任何法律連帶責任。
資料使用須知
| 編號 | 資料名稱 | 資料說明 | 資料收集時間 | 資料格式 |
|---|---|---|---|---|
| 1 | 分類熱門照片(含 EXIF) | 各分類前 10,000 張熱門照片的相關資料,以使用者權限設定「完全公開」,含有 EXIF 與位置資料為限 | 2013年全年 | JSON |
| 2 | 去識別化後的照片 EXIF 資訊 | 資料收集期間所上傳的所有照片的上傳時間、拍攝時間、EXIF 資訊(無位置資料) | 2014年2月 | JSON |
| 3 | 分類人氣部落格相關資料 | 各分類前 1,000 名人氣部落格相關資料 | 2013年 | JSON |
| 4 | 去識別化後的部落格訪客資料 | 資料收集期間所有訪客的作業系統,瀏覽器,螢幕尺寸與設備型號,以及訪問的文章所屬分類 | 2013年7月~12月 | JSON |
下載連結:(稍後公佈)
資料格式:
ZIP 檔案內有 24 個 JSON 檔案,檔案名稱為 "相簿分類 ID",分類名稱請參考頁面上方「資料使用須知」。所有的資料一定有 EXIF 與位置資訊。
[
{
"id": "照片 ID",
"title": "照片標題",
"size": "照片檔案大小,單位為 Bytes",
"type": "pic",
"link": "照片頁面網址",
"url": "照片頁面網址",
"thumb": "照片小縮圖網址",
"uploaded_at": "上傳時間 (Unix Timestamp)",
"hits": {
"total": "累積總人氣",
},
"user": {
"name": "使用者名稱",
"display_name": "使用者暱稱",
"avatar": "使用者頭像",
"link": "使用者連結",
},
"location": {
"geojson": { // 可參考 http://geojson.org/
"type": "Point",
"coordinates": [
"經度",
"緯度"
]
}
},
"exif": {
"Camera": "相機型號",
"ISOSpeedRatings": "ISO值",
"DateTime": "數位化時間",
"DateTimeOriginal": "原始數位化時間",
"DateTaken": "拍攝時間",
"MeteringMode": "測光模式",
"Aperture": "光圈",
"ExposureTime": "快門",
"FocalLength": "焦距",
"Latitude": "緯度",
"Longitude": "經度"
},
"tags": [
"照片標籤"
],
"description": "照片說明",
"taken_at": "拍照時間",
"original": "原始大小圖片網址",
"normal": "中縮圖網址",
"small_square": "小方型縮圖網址",
"square": "方形縮圖網址",
"medium": "中大型縮圖網址",
"bigger": "大縮圖網址",
"large": "超大縮圖網址",
"dimension": {
"original": {
"width": "原始圖寬度",
"height": "原始圖高度"
},
"thumb": {
"width": 90,
"height": 90
},
"small_square": {
"width": 120,
"height": 120
},
"square": {
"width": 170,
"height": 170
},
"medium": {
"width": 450,
"height": 337
},
"normal": {
"width": 600,
"height": 450
}
},
"color": {
"色碼": "顏色佔圖片比例", // 提供前 64 色
},
"category" : "分類ID"
}
]
範例:
[
{
"id": "127671808",
"title": "IMG_0205.JPG",
"size": "2555609",
"type": "pic",
"link": "http:\/\/jnlin.pixnet.net\/album\/photo\/127671808",
"url": "http:\/\/jnlin.pixnet.net\/album\/photo\/127671808",
"thumb": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_t.jpg",
"uploaded_at": "1371984464",
"hits": {
"total": 2,
},
"user": {
"name": "jnlin",
"display_name": "jnlin",
"avatar": "http:\/\/s2.pimg.tw\/avatar\/jnlin\/0\/0\/resize\/90x0.png?v=1259032405",
"link": "http:\/\/jnlin.pixnet.net",
},
"location": {
"latitude": 22.272072600034,
"longitude": 114.13142780001,
"geojson": {
"type": "Point",
"coordinates": [
114.13142780001,
22.272072600034
]
}
},
"exif": {
"Camera": "Canon - Canon EOS Kiss Digital X",
"ISOSpeedRatings": 400,
"DateTime": "2013:06:01 14:36:02",
"DateTimeOriginal": "2013:06:01 14:36:02",
"DateTaken": "2013:06:01 14:36:02",
"MeteringMode": "Pattern",
"Aperture": "f\/4",
"ExposureTime": "0.000 s (1\/4000)",
"FocalLength": "35 mm",
"Latitude": 22.272072600034,
"Longitude": 114.13142780001
},
"tags": [
],
"description": "",
"taken_at": "1370068562",
"original": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400.jpg",
"normal": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_n.jpg",
"small_square": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_s.jpg",
"square": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_q.jpg",
"medium": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_m.jpg",
"bigger": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_b.jpg",
"large": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_l.jpg",
"dimension": {
"original": {
"width": "2592",
"height": "3888"
},
"thumb": {
"width": 90,
"height": 90
},
"small_square": {
"width": 120,
"height": 120
},
"square": {
"width": 170,
"height": 170
},
"medium": {
"width": 300,
"height": 450
},
"bigger": {
"width": 533,
"height": 800
},
"large": {
"width": 682,
"height": 1024
},
"normal": {
"width": 400,
"height": 600
}
},
"color": {
"#D5D6D9": 0.038440740740741,
"#D3D3D4": 0.023148148148148,
"#D1CFD3": 0.021625925925926
},
"category": 0
}
]
下載連結:(稍後公佈)
資料格式:
ZIP 檔案內有 5 個 JSON 檔案,檔案名稱為 YYYY-W.json,每個檔案內含一週的資料,分類名稱請參考頁面上方「資料使用須知」。所有的資料一定有 EXIF 欄位。
[
{
"uploaded_at": "上傳時間 (Unix Timestamp)",
"taken_at": "拍照時間 (Unix Timestamp)",
"exif": {
"Camera": "相機型號",
"ISOSpeedRatings": "ISO值",
"DateTime": "數位化時間",
"DateTimeOriginal": "原始數位化時間",
"DateTaken": "拍攝時間",
"MeteringMode": "測光模式",
"Aperture": "光圈",
"ExposureTime": "快門",
"FocalLength": "焦距",
},
"dimension": {
"original": {
"width": "原始圖寬度",
"height": "原始圖高度"
},
"category" : "分類ID"
}
]
範例:
[
{
"uploaded_at": "1371984464",
"taken_at": "1370068562",
"exif": {
"Camera": "Canon - Canon EOS Kiss Digital X",
"ISOSpeedRatings": 400,
"DateTime": "2013:06:01 14:36:02",
"DateTimeOriginal": "2013:06:01 14:36:02",
"DateTaken": "2013:06:01 14:36:02",
"MeteringMode": "Pattern",
"Aperture": "f\/4",
"ExposureTime": "0.000 s (1\/4000)",
"FocalLength": "35 mm",
},
"dimension": {
"original": {
"width": "2592",
"height": "3888"
}
},
"category": 0
}
]
下載連結:(稍後公佈)
資料格式:
ZIP 檔案內有 41 個 JSON 檔案,檔案名稱為 "部落格分類ID"。部落格分類名稱請參考頁面上方「資料使用須知」。
[
{
"username": "使用者名稱",
"nickname": "使用者暱稱",
"blog": {
"name": "部落格名稱",
"url": "部落格網址",
"hit": "累積部落格人氣",
"comments_count": "累積留言數",
"articles_count": "總發表文章數",
"description": " 部落格描述",
"category": "部落格所屬分類ID",
"rank": {
"all": "全站部落格排名",
"category": "分類部落格排名"
}
},
"usage_days": "使用痞客邦天數",
"subscriber_count": "訂閱數",
"friend_count": "好友數"
}
]
資料範例:
[
{
"username": "admin",
"nickname": "痞客邦站方公告",
"blog": {
"name": "痞客邦 PIXNET 站方部落格",
"url": "http:\/\/admin.pixnet.net\/blog",
"hit": "7238299",
"comments_count": 25598,
"articles_count": 682,
"description": " ",
"category": "15",
"rank": {
"all": 911,
"category": 32
}
},
"usage_days": 3809,
"subscriber_count": 0,
"friend_count": 0
}
]
下載連結:(稍後公佈)
資料格式:
ZIP 檔案內有 1 個 JSON 檔案,檔案名稱為 YYYY-mm.json,表示該月份的訪客資訊。部落格文章分類名稱請參考頁面上方「資料使用須知」。
{
"瀏覽時間(YYYYmmddHH)": {
"部落格文章分類ID": {
"resolution": {
"螢幕解析度": "瀏覽量"
},
"os": {
"作業系統": "瀏覽次數"
},
"browser": {
"瀏覽器": "瀏覽次數"
},
"device": {
"瀏覽裝置": "瀏覽次數"
}
}
}
資料範例:
{
"2014021900": {
"0": {
"resolution": {
"1920x1080": 13,
"1366x768": 37,
"1024x768": 17,
"601x906": 1,
"1680x1050": 3,
"1440x900": 12,
"1536x864": 2,
"1242x698": 1,
"768x1024": 14,
"1600x900": 8,
"1280x1024": 7,
"1088x614": 1,
"1280x800": 10,
"1280x720": 5,
"1249x702": 1,
"x": 1,
"601x914": 1,
"853x512": 1,
"910x512": 1,
"1200x602": 1,
"1152x864": 3,
"600x1024": 2,
"1152x720": 1,
"1049x590": 1,
"601x962": 1,
"781x439": 1,
"1080x1920": 1,
"1024x640": 1,
"941x529": 1,
"1084x677": 1,
"1920x1200": 1,
"1280x960": 1,
"1042x781": 1,
"1438x808": 1,
"800x1232": 1,
"1391x783": 1,
"1024x576": 1,
"1024x1024": 1,
"960x552": 1,
"1360x768": 1
},
"os": {
"Mac OS X": 14,
"Windows 7": 78,
"Android": 9,
"Windows XP": 23,
"Windows Vista": 6,
"iOS": 14,
"Windows 8": 5,
"Windows": 8,
"Linux": 3
},
"browser": {
"Chrome": 73,
"IE": 31,
"Other": 23,
"Mobile Safari": 14,
"Firefox": 8,
"Android": 4,
"Safari": 6,
"BingPreview": 1
},
"device": {
"Other": 136,
"Nexus 7": 2,
"iPad": 14,
"LG-D802": 1,
"ME371MG": 1,
"HTC Flyer": 1,
"GT-P3100": 2,
"SM-T311": 1,
"PadFone 2": 1,
"GT-N8010": 1
}
},
"1": {
"resolution": {
"1920x1080": 1,
"1440x900": 2,
"1366x768": 1,
"x": 1
},
"os": {
"Windows XP": 2,
"Windows 7": 1,
"Windows 8": 1,
"Other": 1
},
"browser": {
"IE": 2,
"Chrome": 1,
"Other": 1,
"Firefox": 1
},
"device": {
"Other": 5
}
}
}
}