PIXNET Hackathon 開放資料說明

以下的資料是 2014 PIXNET Hackathon 活動中開放的資料集。詳細的資料說明與授權如下。

資料使用授權

若您下載下方連結所提供的資料集 (Dataset),表示您同意以下的資料使用授權:

您可以:

您必須:

您不可以:

如您利用提供的資料集,開發任何妨礙善良風俗之違法服務或程式工具,PIXNET 並不為此負任何法律連帶責任。

資料使用須知

Datasets

編號 資料名稱 資料說明 資料收集時間 資料格式
1 分類熱門照片(含 EXIF) 各分類前 10,000 張熱門照片的相關資料,以使用者權限設定「完全公開」,含有 EXIF 與位置資料為限 2013年全年 JSON
2 去識別化後的照片 EXIF 資訊 資料收集期間所上傳的所有照片的上傳時間、拍攝時間、EXIF 資訊(無位置資料) 2014年2月 JSON
3 分類人氣部落格相關資料 各分類前 1,000 名人氣部落格相關資料 2013年 JSON
4 去識別化後的部落格訪客資料 資料收集期間所有訪客的作業系統,瀏覽器,螢幕尺寸與設備型號,以及訪問的文章所屬分類 2013年7月~12月 JSON

1. 分類熱門照片(含 EXIF)

下載連結:(稍後公佈)

資料格式:

ZIP 檔案內有 24 個 JSON 檔案,檔案名稱為 "相簿分類 ID",分類名稱請參考頁面上方「資料使用須知」。所有的資料一定有 EXIF 與位置資訊。

[
    {
        "id": "照片 ID",
        "title": "照片標題",
        "size": "照片檔案大小,單位為 Bytes",
        "type": "pic",
        "link": "照片頁面網址",
        "url": "照片頁面網址",
        "thumb": "照片小縮圖網址",
        "uploaded_at": "上傳時間 (Unix Timestamp)",
        "hits": {
            "total": "累積總人氣",
        },
        "user": {
            "name": "使用者名稱",
            "display_name": "使用者暱稱",
            "avatar": "使用者頭像",
            "link": "使用者連結",
        },
        "location": {
            "geojson": { // 可參考 http://geojson.org/
                "type": "Point",
                "coordinates": [
                    "經度",
                    "緯度"
                ]
            }
        },
        "exif": {
            "Camera": "相機型號",
            "ISOSpeedRatings": "ISO值",
            "DateTime": "數位化時間",
            "DateTimeOriginal": "原始數位化時間",
            "DateTaken": "拍攝時間",
            "MeteringMode": "測光模式",
            "Aperture": "光圈",
            "ExposureTime": "快門",
            "FocalLength": "焦距",
            "Latitude": "緯度",
            "Longitude": "經度"
        },
        "tags": [
            "照片標籤"        
        ],
        "description": "照片說明",
        "taken_at": "拍照時間",
        "original": "原始大小圖片網址",
        "normal": "中縮圖網址",
        "small_square": "小方型縮圖網址",
        "square": "方形縮圖網址",
        "medium": "中大型縮圖網址",
        "bigger": "大縮圖網址",
        "large": "超大縮圖網址",
        "dimension": {
            "original": {
                "width": "原始圖寬度",
                "height": "原始圖高度"
            },
            "thumb": {
                "width": 90,
                "height": 90
            },
            "small_square": {
                "width": 120,
                "height": 120
            },
            "square": {
                "width": 170,
                "height": 170
            },
            "medium": {
                "width": 450,
                "height": 337
            },
            "normal": {
                "width": 600,
                "height": 450
            }
        },
        "color": {
            "色碼": "顏色佔圖片比例", // 提供前 64 色
        },
        "category" : "分類ID"
    }
]

範例:

[
    {
        "id": "127671808",
        "title": "IMG_0205.JPG",
        "size": "2555609",
        "type": "pic",
        "link": "http:\/\/jnlin.pixnet.net\/album\/photo\/127671808",
        "url": "http:\/\/jnlin.pixnet.net\/album\/photo\/127671808",
        "thumb": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_t.jpg",
        "uploaded_at": "1371984464",
        "hits": {
            "total": 2,
        },
        "user": {
            "name": "jnlin",
            "display_name": "jnlin",
            "avatar": "http:\/\/s2.pimg.tw\/avatar\/jnlin\/0\/0\/resize\/90x0.png?v=1259032405",
            "link": "http:\/\/jnlin.pixnet.net",
        },
        "location": {
            "latitude": 22.272072600034,
            "longitude": 114.13142780001,
            "geojson": {
                "type": "Point",
                "coordinates": [
                    114.13142780001,
                    22.272072600034
                ]
            }
        },
        "exif": {
            "Camera": "Canon - Canon EOS Kiss Digital X",
            "ISOSpeedRatings": 400,
            "DateTime": "2013:06:01 14:36:02",
            "DateTimeOriginal": "2013:06:01 14:36:02",
            "DateTaken": "2013:06:01 14:36:02",
            "MeteringMode": "Pattern",
            "Aperture": "f\/4",
            "ExposureTime": "0.000 s (1\/4000)",
            "FocalLength": "35 mm",
            "Latitude": 22.272072600034,
            "Longitude": 114.13142780001
        },
        "tags": [

        ],
        "description": "",
        "taken_at": "1370068562",
        "original": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400.jpg",
        "normal": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_n.jpg",
        "small_square": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_s.jpg",
        "square": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_q.jpg",
        "medium": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_m.jpg",
        "bigger": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_b.jpg",
        "large": "http:\/\/pic.pimg.tw\/jnlin\/1371984461-3267858400_l.jpg",
        "dimension": {
            "original": {
                "width": "2592",
                "height": "3888"
            },
            "thumb": {
                "width": 90,
                "height": 90
            },
            "small_square": {
                "width": 120,
                "height": 120
            },
            "square": {
                "width": 170,
                "height": 170
            },
            "medium": {
                "width": 300,
                "height": 450
            },
            "bigger": {
                "width": 533,
                "height": 800
            },
            "large": {
                "width": 682,
                "height": 1024
            },
            "normal": {
                "width": 400,
                "height": 600
            }
        },
        "color": {
            "#D5D6D9": 0.038440740740741,
            "#D3D3D4": 0.023148148148148,
            "#D1CFD3": 0.021625925925926
        },
        "category": 0
    }
]

2. 去識別化後的照片 EXIF 資訊

下載連結:(稍後公佈)

資料格式:

ZIP 檔案內有 5 個 JSON 檔案,檔案名稱為 YYYY-W.json,每個檔案內含一週的資料,分類名稱請參考頁面上方「資料使用須知」。所有的資料一定有 EXIF 欄位。

[
    {
        "uploaded_at": "上傳時間 (Unix Timestamp)",
        "taken_at": "拍照時間 (Unix Timestamp)",
        "exif": {
            "Camera": "相機型號",
            "ISOSpeedRatings": "ISO值",
            "DateTime": "數位化時間",
            "DateTimeOriginal": "原始數位化時間",
            "DateTaken": "拍攝時間",
            "MeteringMode": "測光模式",
            "Aperture": "光圈",
            "ExposureTime": "快門",
            "FocalLength": "焦距",
        },
        "dimension": {
            "original": {
                "width": "原始圖寬度",
                "height": "原始圖高度"
        },
        "category" : "分類ID"
    }
]

範例:

[
    {
        "uploaded_at": "1371984464",
        "taken_at": "1370068562",
        "exif": {
            "Camera": "Canon - Canon EOS Kiss Digital X",
            "ISOSpeedRatings": 400,
            "DateTime": "2013:06:01 14:36:02",
            "DateTimeOriginal": "2013:06:01 14:36:02",
            "DateTaken": "2013:06:01 14:36:02",
            "MeteringMode": "Pattern",
            "Aperture": "f\/4",
            "ExposureTime": "0.000 s (1\/4000)",
            "FocalLength": "35 mm",
        },        
        "dimension": {
            "original": {
                "width": "2592",
                "height": "3888"
            }
        },
        "category": 0
    }
]

3. 分類人氣部落格相關資料

下載連結:(稍後公佈)

資料格式:

ZIP 檔案內有 41 個 JSON 檔案,檔案名稱為 "部落格分類ID"。部落格分類名稱請參考頁面上方「資料使用須知」。

[
    {
        "username": "使用者名稱",
        "nickname": "使用者暱稱",
        "blog": {
            "name": "部落格名稱",
            "url": "部落格網址",
            "hit": "累積部落格人氣",
            "comments_count": "累積留言數",
            "articles_count": "總發表文章數",
            "description": " 部落格描述",
            "category": "部落格所屬分類ID",
            "rank": {
                "all": "全站部落格排名",
                "category": "分類部落格排名"
            }
        },
        "usage_days": "使用痞客邦天數",
        "subscriber_count": "訂閱數",
        "friend_count": "好友數"
    }
]

資料範例:

[
    {
        "username": "admin",
        "nickname": "痞客邦站方公告",
        "blog": {
            "name": "痞客邦 PIXNET 站方部落格",
            "url": "http:\/\/admin.pixnet.net\/blog",
            "hit": "7238299",
            "comments_count": 25598,
            "articles_count": 682,
            "description": " ",
            "category": "15",
            "rank": {
                "all": 911,
                "category": 32
            }
        },
        "usage_days": 3809,
        "subscriber_count": 0,
        "friend_count": 0
    }
]

4. 去識別化後的部落格訪客資料

下載連結:(稍後公佈)

資料格式:

ZIP 檔案內有 1 個 JSON 檔案,檔案名稱為 YYYY-mm.json,表示該月份的訪客資訊。部落格文章分類名稱請參考頁面上方「資料使用須知」。

{
    "瀏覽時間(YYYYmmddHH)": {
        "部落格文章分類ID": {
            "resolution": {
                "螢幕解析度": "瀏覽量"
            },
            "os": {
                "作業系統": "瀏覽次數"
            },
            "browser": {
                "瀏覽器": "瀏覽次數"
            },
            "device": {
                "瀏覽裝置": "瀏覽次數"
            }
        }
}

資料範例:

{
    "2014021900": {
        "0": {
            "resolution": {
                "1920x1080": 13,
                "1366x768": 37,
                "1024x768": 17,
                "601x906": 1,
                "1680x1050": 3,
                "1440x900": 12,
                "1536x864": 2,
                "1242x698": 1,
                "768x1024": 14,
                "1600x900": 8,
                "1280x1024": 7,
                "1088x614": 1,
                "1280x800": 10,
                "1280x720": 5,
                "1249x702": 1,
                "x": 1,
                "601x914": 1,
                "853x512": 1,
                "910x512": 1,
                "1200x602": 1,
                "1152x864": 3,
                "600x1024": 2,
                "1152x720": 1,
                "1049x590": 1,
                "601x962": 1,
                "781x439": 1,
                "1080x1920": 1,
                "1024x640": 1,
                "941x529": 1,
                "1084x677": 1,
                "1920x1200": 1,
                "1280x960": 1,
                "1042x781": 1,
                "1438x808": 1,
                "800x1232": 1,
                "1391x783": 1,
                "1024x576": 1,
                "1024x1024": 1,
                "960x552": 1,
                "1360x768": 1
            },
            "os": {
                "Mac OS X": 14,
                "Windows 7": 78,
                "Android": 9,
                "Windows XP": 23,
                "Windows Vista": 6,
                "iOS": 14,
                "Windows 8": 5,
                "Windows": 8,
                "Linux": 3
            },
            "browser": {
                "Chrome": 73,
                "IE": 31,
                "Other": 23,
                "Mobile Safari": 14,
                "Firefox": 8,
                "Android": 4,
                "Safari": 6,
                "BingPreview": 1
            },
            "device": {
                "Other": 136,
                "Nexus 7": 2,
                "iPad": 14,
                "LG-D802": 1,
                "ME371MG": 1,
                "HTC Flyer": 1,
                "GT-P3100": 2,
                "SM-T311": 1,
                "PadFone 2": 1,
                "GT-N8010": 1
            }
        },
        "1": {
            "resolution": {
                "1920x1080": 1,
                "1440x900": 2,
                "1366x768": 1,
                "x": 1
            },
            "os": {
                "Windows XP": 2,
                "Windows 7": 1,
                "Windows 8": 1,
                "Other": 1
            },
            "browser": {
                "IE": 2,
                "Chrome": 1,
                "Other": 1,
                "Firefox": 1
            },
            "device": {
                "Other": 5
            }
        }
    }
}