you-get/src/you_get/extractors/miaopai.py

#!/usr/bin/env python

__all__ = ['miaopai_download']

from ..common import *
import urllib.error
import urllib.parse

fake_headers_mobile = {
    'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Accept-Charset': 'UTF-8,*;q=0.5',
    'Accept-Encoding': 'gzip,deflate,sdch',
    'Accept-Language': 'en-US,en;q=0.8',
    'User-Agent': 'Mozilla/5.0 (Linux; Android 4.4.2; Nexus 4 Build/KOT49H) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.114 Mobile Safari/537.36'
}

def miaopai_download_by_fid(fid, output_dir = '.', merge = False, info_only = False, **kwargs):
    '''Source: Android mobile'''
    page_url = 'http://video.weibo.com/show?fid=' + fid + '&type=mp4'

    mobile_page = get_content(page_url, headers=fake_headers_mobile)
    url = match1(mobile_page, r'<video id=.*?src=[\'"](.*?)[\'"]\W')
    title = match1(mobile_page, r'<title>((.|\n)+?)</title>')
    if not title:
        title = fid
    title = title.replace('\n', '_')
    ext, size = 'mp4', url_info(url)[2]
    print_info(site_info, title, ext, size)
    if not info_only:
        download_urls([url], title, ext, total_size=None, output_dir=output_dir, merge=merge)

#----------------------------------------------------------------------
def miaopai_download(url, output_dir = '.', merge = False, info_only = False, **kwargs):
    fid = match1(url, r'\?fid=(\d{4}:\w{32})')
    if fid is not None:
        miaopai_download_by_fid(fid, output_dir, merge, info_only)
    elif '/p/230444' in url:
        fid = match1(url, r'/p/230444(\w+)')
        miaopai_download_by_fid('1034:'+fid, output_dir, merge, info_only)
    else:
        mobile_page = get_content(url, headers = fake_headers_mobile)
        hit = re.search(r'"page_url"\s*:\s*"([^"]+)"', mobile_page)
        if not hit:
            raise Exception('Unknown pattern')
        else:
            escaped_url = hit.group(1)
            miaopai_download(urllib.parse.unquote(escaped_url), output_dir=output_dir, merge=merge, info_only=info_only, **kwargs)

site_info = "miaopai"
download = miaopai_download
download_playlist = playlist_not_supported('miaopai')
Add Weibo Miaopai support 2015-08-23 09:14:12 +03:00			`#!/usr/bin/env python`

			`__all__ = ['miaopai_download']`

			`from ..common import *`
			`import urllib.error`
[miaopai]new url pattern 2017-07-30 17:15:24 +03:00			`import urllib.parse`

			`fake_headers_mobile = {`
			`'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8',`
			`'Accept-Charset': 'UTF-8,*;q=0.5',`
			`'Accept-Encoding': 'gzip,deflate,sdch',`
			`'Accept-Language': 'en-US,en;q=0.8',`
			`'User-Agent': 'Mozilla/5.0 (Linux; Android 4.4.2; Nexus 4 Build/KOT49H) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.114 Mobile Safari/537.36'`
			`}`
Add Weibo Miaopai support 2015-08-23 09:14:12 +03:00
refactoring 2017-04-24 15:37:45 +03:00			`def miaopai_download_by_fid(fid, output_dir = '.', merge = False, info_only = False, **kwargs):`
Add Weibo Miaopai support 2015-08-23 09:14:12 +03:00			`'''Source: Android mobile'''`
refactoring 2017-04-24 15:37:45 +03:00			`page_url = 'http://video.weibo.com/show?fid=' + fid + '&type=mp4'`

			`mobile_page = get_content(page_url, headers=fake_headers_mobile)`
			`url = match1(mobile_page, r'<video id=.?src=[\'"](.?)[\'"]\W')`
fix weibo title when character "<" existed 2017-07-17 11:17:43 +03:00			`title = match1(mobile_page, r'<title>((.\|\n)+?)</title>')`
			`if not title:`
			`title = fid`
			`title = title.replace('\n', '_')`
[miaopai] fix mp4 extension 2017-08-12 01:02:57 +03:00			`ext, size = 'mp4', url_info(url)[2]`
			`print_info(site_info, title, ext, size)`
refactoring 2017-04-24 15:37:45 +03:00			`if not info_only:`
fix weibo title when character "<" existed 2017-07-17 11:17:43 +03:00			`download_urls([url], title, ext, total_size=None, output_dir=output_dir, merge=merge)`
Add Weibo Miaopai support 2015-08-23 09:14:12 +03:00
[Miaopai]Add Weibo URL pattern without login 2016-03-01 01:22:47 +03:00			`#----------------------------------------------------------------------`
			`def miaopai_download(url, output_dir = '.', merge = False, info_only = False, **kwargs):`
refactoring 2017-04-24 15:37:45 +03:00			`fid = match1(url, r'\?fid=(\d{4}:\w{32})')`
			`if fid is not None:`
			`miaopai_download_by_fid(fid, output_dir, merge, info_only)`
			`elif '/p/230444' in url:`
			`fid = match1(url, r'/p/230444(\w+)')`
			`miaopai_download_by_fid('1034:'+fid, output_dir, merge, info_only)`
			`else:`
[miaopai]new url pattern 2017-07-30 17:15:24 +03:00			`mobile_page = get_content(url, headers = fake_headers_mobile)`
			`hit = re.search(r'"page_url"\s:\s"([^"]+)"', mobile_page)`
			`if not hit:`
			`raise Exception('Unknown pattern')`
			`else:`
			`escaped_url = hit.group(1)`
			`miaopai_download(urllib.parse.unquote(escaped_url), output_dir=output_dir, merge=merge, info_only=info_only, **kwargs)`
Add Weibo Miaopai support 2015-08-23 09:14:12 +03:00
			`site_info = "miaopai"`
			`download = miaopai_download`
fix extractors not use VideoExtractor after add --json option 2015-09-26 08:45:39 +03:00			`download_playlist = playlist_not_supported('miaopai')`