you-get/src/you_get/extractors/qq.py

#!/usr/bin/env python

__all__ = ['qq_download']

from ..common import *
from .qie import download as qieDownload
from urllib.parse import urlparse,parse_qs

def qq_download_by_vid(vid, title, output_dir='.', merge=True, info_only=False):
    info_api = 'http://vv.video.qq.com/getinfo?otype=json&appver=3%2E2%2E19%2E333&platform=11&defnpayver=1&vid=' + vid
    info = get_html(info_api)
    video_json = json.loads(match1(info, r'QZOutputJson=(.*)')[:-1])
    parts_vid = video_json['vl']['vi'][0]['vid']
    parts_ti = video_json['vl']['vi'][0]['ti']
    parts_prefix = video_json['vl']['vi'][0]['ul']['ui'][0]['url']
    parts_formats = video_json['fl']['fi']
    # find best quality
    # only looking for fhd(1080p) and shd(720p) here.
    # 480p usually come with a single file, will be downloaded as fallback.
    best_quality = ''
    for part_format in parts_formats:
        if part_format['name'] == 'fhd':
            best_quality = 'fhd'
            break

        if part_format['name'] == 'shd':
            best_quality = 'shd'

    for part_format in parts_formats:
        if (not best_quality == '') and (not part_format['name'] == best_quality):
            continue
        part_format_id = part_format['id']
        part_format_sl = part_format['sl']
        if part_format_sl == 0:
            part_urls= []
            total_size = 0
            try:
                # For fhd(1080p), every part is about 100M and 6 minutes
                # try 100 parts here limited download longest single video of 10 hours.
                for part in range(1,100):
                    filename = vid + '.p' + str(part_format_id % 1000) + '.' + str(part) + '.mp4'
                    key_api = "http://vv.video.qq.com/getkey?otype=json&platform=11&format=%s&vid=%s&filename=%s" % (part_format_id, parts_vid, filename)
                    #print(filename)
                    #print(key_api)
                    part_info = get_html(key_api)
                    key_json = json.loads(match1(part_info, r'QZOutputJson=(.*)')[:-1])
                    #print(key_json)
                    vkey = key_json['key']
                    url = '%s/%s?vkey=%s' % (parts_prefix, filename, vkey)
                    part_urls.append(url)
                    _, ext, size = url_info(url, faker=True)
                    total_size += size
            except:
                pass
            print_info(site_info, parts_ti, ext, total_size)
            if not info_only:
                download_urls(part_urls, parts_ti, ext, total_size, output_dir=output_dir, merge=merge)
        else:
            fvkey = video_json['vl']['vi'][0]['fvkey']
            mp4 = video_json['vl']['vi'][0]['cl'].get('ci', None)
            if mp4:
                mp4 = mp4[0]['keyid'].replace('.10', '.p') + '.mp4'
            else:
                mp4 = video_json['vl']['vi'][0]['fn']
            url = '%s/%s?vkey=%s' % ( parts_prefix, mp4, fvkey )
            _, ext, size = url_info(url, faker=True)

            print_info(site_info, title, ext, size)
            if not info_only:
                download_urls([url], title, ext, size, output_dir=output_dir, merge=merge)


def qq_download(url, output_dir='.', merge=True, info_only=False, **kwargs):
    """"""
    if 'live.qq.com' in url:
        qieDownload(url,output_dir=output_dir, merge=merge, info_only=info_only)
        return

    #do redirect
    if 'v.qq.com/page' in url:
        # for URLs like this:
        # http://v.qq.com/page/k/9/7/k0194pwgw97.html
        content = get_html(url)
        url = match1(content,r'window\.location\.href="(.*?)"')

    if 'kuaibao.qq.com' in url or re.match(r'http://daxue.qq.com/content/content/id/\d+', url):
        content = get_html(url)
        vid = match1(content, r'vid\s*=\s*"\s*([^"]+)"')
        title = match1(content, r'title">([^"]+)</p>')
        title = title.strip() if title else vid
    elif 'iframe/player.html' in url:
        vid = match1(url, r'\bvid=(\w+)')
        # for embedded URLs; don't know what the title is
        title = vid
    else:
        content = get_html(url)
        vid = parse_qs(urlparse(url).query).get('vid') #for links specified vid  like http://v.qq.com/cover/p/ps6mnfqyrfo7es3.html?vid=q0181hpdvo5
        vid = vid[0] if vid else match1(content, r'vid"*\s*:\s*"\s*([^"]+)"') #general fallback
        title = match1(content,r'<a.*?id\s*=\s*"%s".*?title\s*=\s*"(.+?)".*?>'%vid)
        title = match1(content, r'title">([^"]+)</p>') if not title else title
        title = match1(content, r'"title":"([^"]+)"') if not title else title
        title = vid if not title else title #general fallback


    qq_download_by_vid(vid, title, output_dir, merge, info_only)

site_info = "QQ.com"
download = qq_download
download_playlist = playlist_not_supported('qq')
add support for V.QQ.com, fix #31 2012-12-01 19:14:04 +04:00			`#!/usr/bin/env python`

			`__all__ = ['qq_download']`

			`from ..common import *`
[QiE]Add Support 2016-05-20 11:28:30 +03:00			`from .qie import download as qieDownload`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00			`from urllib.parse import urlparse,parse_qs`
[QQ]Add QQ Daxue 2016-08-04 04:39:10 +03:00
[qq] reimplement qq.py, close #657 2015-09-21 00:55:19 +03:00			`def qq_download_by_vid(vid, title, output_dir='.', merge=True, info_only=False):`
Tencent Video use best quality Prefer 1080p and 720p if available 2016-10-02 19:18:50 +03:00			`info_api = 'http://vv.video.qq.com/getinfo?otype=json&appver=3%2E2%2E19%2E333&platform=11&defnpayver=1&vid=' + vid`
			`info = get_html(info_api)`
			`video_json = json.loads(match1(info, r'QZOutputJson=(.*)')[:-1])`
			`parts_vid = video_json['vl']['vi'][0]['vid']`
			`parts_ti = video_json['vl']['vi'][0]['ti']`
			`parts_prefix = video_json['vl']['vi'][0]['ul']['ui'][0]['url']`
			`parts_formats = video_json['fl']['fi']`
			`# find best quality`
			`# only looking for fhd(1080p) and shd(720p) here.`
			`# 480p usually come with a single file, will be downloaded as fallback.`
			`best_quality = ''`
			`for part_format in parts_formats:`
			`if part_format['name'] == 'fhd':`
			`best_quality = 'fhd'`
			`break`

			`if part_format['name'] == 'shd':`
			`best_quality = 'shd'`

			`for part_format in parts_formats:`
			`if (not best_quality == '') and (not part_format['name'] == best_quality):`
			`continue`
			`part_format_id = part_format['id']`
			`part_format_sl = part_format['sl']`
			`if part_format_sl == 0:`
			`part_urls= []`
			`total_size = 0`
			`try:`
			`# For fhd(1080p), every part is about 100M and 6 minutes`
			`# try 100 parts here limited download longest single video of 10 hours.`
			`for part in range(1,100):`
			`filename = vid + '.p' + str(part_format_id % 1000) + '.' + str(part) + '.mp4'`
			`key_api = "http://vv.video.qq.com/getkey?otype=json&platform=11&format=%s&vid=%s&filename=%s" % (part_format_id, parts_vid, filename)`
			`#print(filename)`
			`#print(key_api)`
			`part_info = get_html(key_api)`
			`key_json = json.loads(match1(part_info, r'QZOutputJson=(.*)')[:-1])`
			`#print(key_json)`
			`vkey = key_json['key']`
			`url = '%s/%s?vkey=%s' % (parts_prefix, filename, vkey)`
			`part_urls.append(url)`
			`_, ext, size = url_info(url, faker=True)`
			`total_size += size`
			`except:`
			`pass`
			`print_info(site_info, parts_ti, ext, total_size)`
			`if not info_only:`
			`download_urls(part_urls, parts_ti, ext, total_size, output_dir=output_dir, merge=merge)`
			`else:`
fix for NameError: name 'output_json' is not defined 2016-11-28 18:01:42 +03:00			`fvkey = video_json['vl']['vi'][0]['fvkey']`
			`mp4 = video_json['vl']['vi'][0]['cl'].get('ci', None)`
Tencent Video use best quality Prefer 1080p and 720p if available 2016-10-02 19:18:50 +03:00			`if mp4:`
			`mp4 = mp4[0]['keyid'].replace('.10', '.p') + '.mp4'`
			`else:`
fix for NameError: name 'output_json' is not defined 2016-11-28 18:01:42 +03:00			`mp4 = video_json['vl']['vi'][0]['fn']`
Tencent Video use best quality Prefer 1080p and 720p if available 2016-10-02 19:18:50 +03:00			`url = '%s/%s?vkey=%s' % ( parts_prefix, mp4, fvkey )`
			`_, ext, size = url_info(url, faker=True)`

			`print_info(site_info, title, ext, size)`
			`if not info_only:`
			`download_urls([url], title, ext, size, output_dir=output_dir, merge=merge)`
add support for V.QQ.com, fix #31 2012-12-01 19:14:04 +04:00
[QQ]Add QQ Daxue 2016-08-04 04:39:10 +03:00
fix extractors not use VideoExtractor after add --json option 2015-09-26 08:45:39 +03:00			`def qq_download(url, output_dir='.', merge=True, info_only=False, **kwargs):`
[QQ]Add QQ Daxue 2016-08-04 04:39:10 +03:00			`""""""`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00			`if 'live.qq.com' in url:`
			`qieDownload(url,output_dir=output_dir, merge=merge, info_only=info_only)`
[qq] fix #1355 2016-08-21 19:54:58 +03:00			`return`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00
			`#do redirect`
support for redirect URLs 2016-04-19 12:38:27 +03:00			`if 'v.qq.com/page' in url:`
			`# for URLs like this:`
			`# http://v.qq.com/page/k/9/7/k0194pwgw97.html`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00			`content = get_html(url)`
			`url = match1(content,r'window\.location\.href="(.*?)"')`
[qq] fix #1355 2016-08-21 19:54:58 +03:00
[QQ]Add QQ Daxue 2016-08-04 04:39:10 +03:00			`if 'kuaibao.qq.com' in url or re.match(r'http://daxue.qq.com/content/content/id/\d+', url):`
add support to kuaibao.qq.com 2016-04-19 13:33:38 +03:00			`content = get_html(url)`
			`vid = match1(content, r'vid\s=\s"\s*([^"]+)"')`
some url like this http://kuaibao.qq.com/s/SPO2016050503989500 got the title failed will raise exception 2016-05-06 13:41:11 +03:00			`title = match1(content, r'title">([^"]+)</p>')`
			`title = title.strip() if title else vid`
support for redirect URLs 2016-04-19 12:38:27 +03:00			`elif 'iframe/player.html' in url:`
[qq] support for embedded video URLs e.g. http://v.qq.com/iframe/player.html?vid=q01536xb5rb&tiny=0&auto=0 2016-01-23 06:38:11 +03:00			`vid = match1(url, r'\bvid=(\w+)')`
			`# for embedded URLs; don't know what the title is`
			`title = vid`
			`else:`
			`content = get_html(url)`
[qq] fix #1355 2016-08-21 19:54:58 +03:00			`vid = parse_qs(urlparse(url).query).get('vid') #for links specified vid like http://v.qq.com/cover/p/ps6mnfqyrfo7es3.html?vid=q0181hpdvo5`
qq compatible with new urls and modify baomihua getvidourl address 2016-08-29 14:14:29 +03:00			`vid = vid[0] if vid else match1(content, r'vid"\s:\s"\s([^"]+)"') #general fallback`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00			`title = match1(content,r'<a.?id\s=\s"%s".?title\s=\s"(.+?)".*?>'%vid)`
			`title = match1(content, r'title">([^"]+)</p>') if not title else title`
[qq] fix #1355 2016-08-21 19:54:58 +03:00			`title = match1(content, r'"title":"([^"]+)"') if not title else title`
[QQ] more robust url extractor 2016-05-28 12:32:07 +03:00			`title = vid if not title else title #general fallback`


[qq] reimplement qq.py, close #657 2015-09-21 00:55:19 +03:00
fix qq support 2015-01-10 10:06:34 +03:00			`qq_download_by_vid(vid, title, output_dir, merge, info_only)`
add support for V.QQ.com, fix #31 2012-12-01 19:14:04 +04:00
add support for NetEase, fix #59 2013-01-11 07:43:30 +04:00			`site_info = "QQ.com"`
add support for V.QQ.com, fix #31 2012-12-01 19:14:04 +04:00			`download = qq_download`
			`download_playlist = playlist_not_supported('qq')`