you-get/src/you_get/extractors/baidu.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-

__all__ = ['baidu_download']

from ..common import *
from .embed import *
from .universal import *


def baidu_get_song_data(sid):
    data = json.loads(get_html(
        'http://music.baidu.com/data/music/fmlink?songIds=%s' % sid, faker=True))['data']

    if data['xcode'] != '':
        # inside china mainland
        return data['songList'][0]
    else:
        # outside china mainland
        return None


def baidu_get_song_url(data):
    return data['songLink']


def baidu_get_song_artist(data):
    return data['artistName']


def baidu_get_song_album(data):
    return data['albumName']


def baidu_get_song_title(data):
    return data['songName']


def baidu_get_song_lyric(data):
    lrc = data['lrcLink']
    return None if lrc is '' else "http://music.baidu.com%s" % lrc


def baidu_download_song(sid, output_dir='.', merge=True, info_only=False):
    data = baidu_get_song_data(sid)
    if data is not None:
        url = baidu_get_song_url(data)
        title = baidu_get_song_title(data)
        artist = baidu_get_song_artist(data)
        album = baidu_get_song_album(data)
        lrc = baidu_get_song_lyric(data)
        file_name = "%s - %s - %s" % (title, album, artist)
    else:
        html = get_html("http://music.baidu.com/song/%s" % sid)
        url = r1(r'data_url="([^"]+)"', html)
        title = r1(r'data_name="([^"]+)"', html)
        file_name = title

    type, ext, size = url_info(url, faker=True)
    print_info(site_info, title, type, size)
    if not info_only:
        download_urls([url], file_name, ext, size,
                      output_dir, merge=merge, faker=True)

    try:
        type, ext, size = url_info(lrc, faker=True)
        print_info(site_info, title, type, size)
        if not info_only:
            download_urls([lrc], file_name, ext, size, output_dir, faker=True)
    except:
        pass


def baidu_download_album(aid, output_dir='.', merge=True, info_only=False):
    html = get_html('http://music.baidu.com/album/%s' % aid, faker=True)
    album_name = r1(r'<h2 class="album-name">(.+?)<\/h2>', html)
    artist = r1(r'<span class="author_list" title="(.+?)">', html)
    output_dir = '%s/%s - %s' % (output_dir, artist, album_name)
    ids = json.loads(r1(r'<span class="album-add" data-adddata=\'(.+?)\'>',
                        html).replace('&quot', '').replace(';', '"'))['ids']
    track_nr = 1
    for id in ids:
        song_data = baidu_get_song_data(id)
        song_url = baidu_get_song_url(song_data)
        song_title = baidu_get_song_title(song_data)
        song_lrc = baidu_get_song_lyric(song_data)
        file_name = '%02d.%s' % (track_nr, song_title)

        type, ext, size = url_info(song_url, faker=True)
        print_info(site_info, song_title, type, size)
        if not info_only:
            download_urls([song_url], file_name, ext, size,
                          output_dir, merge=merge, faker=True)

        if song_lrc:
            type, ext, size = url_info(song_lrc, faker=True)
            print_info(site_info, song_title, type, size)
            if not info_only:
                download_urls([song_lrc], file_name, ext,
                              size, output_dir, faker=True)

        track_nr += 1


def baidu_download(url, output_dir='.', stream_type=None, merge=True, info_only=False, **kwargs):

    if re.match(r'http://pan.baidu.com', url):
        real_url, title, ext, size = baidu_pan_download(url)
        if not info_only:
            download_urls([real_url], title, ext, size,
                          output_dir, url, merge=merge, faker=True)
    elif re.match(r'http://music.baidu.com/album/\d+', url):
        id = r1(r'http://music.baidu.com/album/(\d+)', url)
        baidu_download_album(id, output_dir, merge, info_only)

    elif re.match('http://music.baidu.com/song/\d+', url):
        id = r1(r'http://music.baidu.com/song/(\d+)', url)
        baidu_download_song(id, output_dir, merge, info_only)

    elif re.match('http://tieba.baidu.com/', url):
        try:
            # embedded videos
            embed_download(url, output_dir, merge=merge, info_only=info_only)
        except:
            # images
            html = get_html(url)
            title = r1(r'title:"([^"]+)"', html)

            items = re.findall(
                r'//imgsrc.baidu.com/forum/w[^"]+/([^/"]+)', html)
            urls = ['http://imgsrc.baidu.com/forum/pic/item/' + i
                    for i in set(items)]

            # handle albums
            kw = r1(r'kw=([^&]+)', html) or r1(r"kw:'([^']+)'", html)
            tid = r1(r'tid=(\d+)', html) or r1(r"tid:'([^']+)'", html)
            album_url = 'http://tieba.baidu.com/photo/g/bw/picture/list?kw=%s&tid=%s' % (
                kw, tid)
            album_info = json.loads(get_content(album_url))
            for i in album_info['data']['pic_list']:
                urls.append(
                    'http://imgsrc.baidu.com/forum/pic/item/' + i['pic_id'] + '.jpg')

            ext = 'jpg'
            size = float('Inf')
            print_info(site_info, title, ext, size)

            if not info_only:
                download_urls(urls, title, ext, size,
                              output_dir=output_dir, merge=False)


def baidu_pan_download(url):
    errno_patt = r'errno":([^"]+),'
    refer_url = ""
    fake_headers = {
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Accept-Charset': 'UTF-8,*;q=0.5',
        'Accept-Encoding': 'gzip,deflate,sdch',
        'Accept-Language': 'en-US,en;q=0.8',
        'Host': 'pan.baidu.com',
        'Origin': 'http://pan.baidu.com',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:13.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2500.0 Safari/537.36',
        'Referer': refer_url
    }
    if cookies:
        print('Use user specified cookies')
    else:
        print('Generating cookies...')
        fake_headers['Cookie'] = baidu_pan_gen_cookies(url)
    refer_url = "http://pan.baidu.com"
    html = get_content(url, fake_headers, decoded=True)
    isprotected = False
    sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(
        html)
    if sign == None:
        if re.findall(r'\baccess-code\b', html):
            isprotected = True
            sign, timestamp, bdstoken, appid, primary_id, fs_id, uk, fake_headers, psk = baidu_pan_protected_share(
                url)
            # raise NotImplementedError("Password required!")
        if isprotected != True:
            raise AssertionError("Share not found or canceled: %s" % url)
    if bdstoken == None:
        bdstoken = ""
    if isprotected != True:
        sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(
            html)
    request_url = "http://pan.baidu.com/api/sharedownload?sign=%s&timestamp=%s&bdstoken=%s&channel=chunlei&clienttype=0&web=1&app_id=%s" % (
        sign, timestamp, bdstoken, appid)
    refer_url = url
    post_data = {
        'encrypt': 0,
        'product': 'share',
        'uk': uk,
        'primaryid': primary_id,
        'fid_list': '[' + fs_id + ']'
    }
    if isprotected == True:
        post_data['sekey'] = psk
    response_content = post_content(request_url, fake_headers, post_data, True)
    errno = match1(response_content, errno_patt)
    if errno != "0":
        raise AssertionError(
            "Server refused to provide download link! (Errno:%s)" % errno)
    real_url = r1(r'dlink":"([^"]+)"', response_content).replace('\\/', '/')
    title = r1(r'server_filename":"([^"]+)"', response_content)
    assert real_url
    type, ext, size = url_info(real_url, faker=True)
    title_wrapped = json.loads('{"wrapper":"%s"}' % title)
    title = title_wrapped['wrapper']
    logging.debug(real_url)
    print_info(site_info, title, ext, size)
    print('Hold on...')
    time.sleep(5)
    return real_url, title, ext, size


def baidu_pan_parse(html):
    sign_patt = r'sign":"([^"]+)"'
    timestamp_patt = r'timestamp":([^"]+),'
    appid_patt = r'app_id":"([^"]+)"'
    bdstoken_patt = r'bdstoken":"([^"]+)"'
    fs_id_patt = r'fs_id":([^"]+),'
    uk_patt = r'uk":([^"]+),'
    errno_patt = r'errno":([^"]+),'
    primary_id_patt = r'shareid":([^"]+),'
    sign = match1(html, sign_patt)
    timestamp = match1(html, timestamp_patt)
    appid = match1(html, appid_patt)
    bdstoken = match1(html, bdstoken_patt)
    fs_id = match1(html, fs_id_patt)
    uk = match1(html, uk_patt)
    primary_id = match1(html, primary_id_patt)
    return sign, timestamp, bdstoken, appid, primary_id, fs_id, uk


def baidu_pan_gen_cookies(url, post_data=None):
    from http import cookiejar
    cookiejar = cookiejar.CookieJar()
    opener = request.build_opener(request.HTTPCookieProcessor(cookiejar))
    resp = opener.open('http://pan.baidu.com')
    if post_data != None:
        resp = opener.open(url, bytes(parse.urlencode(post_data), 'utf-8'))
    return cookjar2hdr(cookiejar)


def baidu_pan_protected_share(url):
    print('This share is protected by password!')
    inpwd = input('Please provide unlock password: ')
    inpwd = inpwd.replace(' ', '').replace('\t', '')
    print('Please wait...')
    post_pwd = {
        'pwd': inpwd,
        'vcode': None,
        'vstr': None
    }
    from http import cookiejar
    import time
    cookiejar = cookiejar.CookieJar()
    opener = request.build_opener(request.HTTPCookieProcessor(cookiejar))
    resp = opener.open('http://pan.baidu.com')
    resp = opener.open(url)
    init_url = resp.geturl()
    verify_url = 'http://pan.baidu.com/share/verify?%s&t=%s&channel=chunlei&clienttype=0&web=1' % (
        init_url.split('?', 1)[1], int(time.time()))
    refer_url = init_url
    fake_headers = {
        'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Accept-Charset': 'UTF-8,*;q=0.5',
        'Accept-Encoding': 'gzip,deflate,sdch',
        'Accept-Language': 'en-US,en;q=0.8',
        'Host': 'pan.baidu.com',
        'Origin': 'http://pan.baidu.com',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:13.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2500.0 Safari/537.36',
        'Referer': refer_url
    }
    opener.addheaders = dict2triplet(fake_headers)
    pwd_resp = opener.open(verify_url, bytes(
        parse.urlencode(post_pwd), 'utf-8'))
    pwd_resp_str = ungzip(pwd_resp.read()).decode('utf-8')
    pwd_res = json.loads(pwd_resp_str)
    if pwd_res['errno'] != 0:
        raise AssertionError(
            'Server returned an error: %s (Incorrect password?)' % pwd_res['errno'])
    pg_resp = opener.open('http://pan.baidu.com/share/link?%s' %
                          init_url.split('?', 1)[1])
    content = ungzip(pg_resp.read()).decode('utf-8')
    sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(
        content)
    psk = query_cookiejar(cookiejar, 'BDCLND')
    psk = parse.unquote(psk)
    fake_headers['Cookie'] = cookjar2hdr(cookiejar)
    return sign, timestamp, bdstoken, appid, primary_id, fs_id, uk, fake_headers, psk


def cookjar2hdr(cookiejar):
    cookie_str = ''
    for i in cookiejar:
        cookie_str = cookie_str + i.name + '=' + i.value + ';'
    return cookie_str[:-1]


def query_cookiejar(cookiejar, name):
    for i in cookiejar:
        if i.name == name:
            return i.value


def dict2triplet(dictin):
    out_triplet = []
    for i in dictin:
        out_triplet.append((i, dictin[i]))
    return out_triplet

site_info = "Baidu.com"
download = baidu_download
download_playlist = playlist_not_supported("baidu")
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`#!/usr/bin/env python`
			`# -- coding: utf-8 --`

			`__all__ = ['baidu_download']`

			`from ..common import *`
[baidu] support tieba videos and images 2015-10-20 01:52:06 +03:00			`from .embed import *`
[baidu] support direct URLs (imgsrc.baidu.com) 2015-11-24 06:36:52 +03:00			`from .universal import *`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_data(sid):`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`data = json.loads(get_html(`
			`'http://music.baidu.com/data/music/fmlink?songIds=%s' % sid, faker=True))['data']`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`if data['xcode'] != '':`
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`# inside china mainland`
Update baidu.py 2013-10-04 17:15:04 +04:00			`return data['songList'][0]`
			`else:`
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`# outside china mainland`
			`return None`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_url(data):`
			`return data['songLink']`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_artist(data):`
			`return data['artistName']`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_album(data):`
			`return data['albumName']`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_title(data):`
			`return data['songName']`
baidu:fix download error issue twlz0ne/you-get#4 2013-05-13 11:55:42 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Update baidu.py 2013-10-04 17:15:04 +04:00			`def baidu_get_song_lyric(data):`
			`lrc = data['lrcLink']`
			`return None if lrc is '' else "http://music.baidu.com%s" % lrc`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`def baidu_download_song(sid, output_dir='.', merge=True, info_only=False):`
Update baidu.py 2013-10-04 17:15:04 +04:00			`data = baidu_get_song_data(sid)`
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`if data is not None:`
			`url = baidu_get_song_url(data)`
			`title = baidu_get_song_title(data)`
			`artist = baidu_get_song_artist(data)`
			`album = baidu_get_song_album(data)`
			`lrc = baidu_get_song_lyric(data)`
			`file_name = "%s - %s - %s" % (title, album, artist)`
			`else:`
			`html = get_html("http://music.baidu.com/song/%s" % sid)`
			`url = r1(r'data_url="([^"]+)"', html)`
			`title = r1(r'data_name="([^"]+)"', html)`
			`file_name = title`
Update baidu.py 2013-10-04 17:15:04 +04:00
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`type, ext, size = url_info(url, faker=True)`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`print_info(site_info, title, type, size)`
			`if not info_only:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`download_urls([url], file_name, ext, size,`
			`output_dir, merge=merge, faker=True)`
Update baidu.py 2013-10-04 17:15:04 +04:00
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`try:`
			`type, ext, size = url_info(lrc, faker=True)`
Update baidu.py 2013-10-04 17:15:04 +04:00			`print_info(site_info, title, type, size)`
			`if not info_only:`
Baidu Music: fix #342 for overseas IP 2014-06-22 15:44:51 +04:00			`download_urls([lrc], file_name, ext, size, output_dir, faker=True)`
			`except:`
			`pass`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
			`def baidu_download_album(aid, output_dir='.', merge=True, info_only=False):`
			`html = get_html('http://music.baidu.com/album/%s' % aid, faker=True)`
baidu:fix download error issue twlz0ne/you-get#4 2013-05-13 11:55:42 +04:00			`album_name = r1(r'<h2 class="album-name">(.+?)<\/h2>', html)`
			`artist = r1(r'<span class="author_list" title="(.+?)">', html)`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`output_dir = '%s/%s - %s' % (output_dir, artist, album_name)`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`ids = json.loads(r1(r'<span class="album-add" data-adddata=\'(.+?)\'>',`
			`html).replace('&quot', '').replace(';', '"'))['ids']`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`track_nr = 1`
			`for id in ids:`
Update baidu.py 2013-10-04 17:15:04 +04:00			`song_data = baidu_get_song_data(id)`
			`song_url = baidu_get_song_url(song_data)`
			`song_title = baidu_get_song_title(song_data)`
			`song_lrc = baidu_get_song_lyric(song_data)`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`file_name = '%02d.%s' % (track_nr, song_title)`
Update baidu.py 2013-10-04 17:15:04 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`type, ext, size = url_info(song_url, faker=True)`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`print_info(site_info, song_title, type, size)`
			`if not info_only:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`download_urls([song_url], file_name, ext, size,`
			`output_dir, merge=merge, faker=True)`
Update baidu.py 2013-10-04 17:15:04 +04:00
			`if song_lrc:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`type, ext, size = url_info(song_lrc, faker=True)`
Update baidu.py 2013-10-04 17:15:04 +04:00			`print_info(site_info, song_title, type, size)`
			`if not info_only:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`download_urls([song_lrc], file_name, ext,`
			`size, output_dir, faker=True)`
Update baidu.py 2013-10-04 17:15:04 +04:00
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`track_nr += 1`

Update baidu.py 2013-10-04 17:15:04 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`def baidu_download(url, output_dir='.', stream_type=None, merge=True, info_only=False, **kwargs):`
Update baidu.py 2013-10-04 17:15:04 +04:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`if re.match(r'http://pan.baidu.com', url):`
			`real_url, title, ext, size = baidu_pan_download(url)`
add support for Baidu Wangpan, fix #177 2013-06-07 03:22:51 +04:00			`if not info_only:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`download_urls([real_url], title, ext, size,`
			`output_dir, url, merge=merge, faker=True)`
add support for Baidu Wangpan, fix #177 2013-06-07 03:22:51 +04:00			`elif re.match(r'http://music.baidu.com/album/\d+', url):`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`id = r1(r'http://music.baidu.com/album/(\d+)', url)`
			`baidu_download_album(id, output_dir, merge, info_only)`

add support for Baidu Wangpan, fix #177 2013-06-07 03:22:51 +04:00			`elif re.match('http://music.baidu.com/song/\d+', url):`
add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`id = r1(r'http://music.baidu.com/song/(\d+)', url)`
			`baidu_download_song(id, output_dir, merge, info_only)`

[baidu] support tieba videos and images 2015-10-20 01:52:06 +03:00			`elif re.match('http://tieba.baidu.com/', url):`
			`try:`
			`# embedded videos`
			`embed_download(url, output_dir, merge=merge, info_only=info_only)`
			`except:`
			`# images`
			`html = get_html(url)`
			`title = r1(r'title:"([^"]+)"', html)`
[baidu] support tieba albums 2015-10-21 01:09:31 +03:00
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`items = re.findall(`
			`r'//imgsrc.baidu.com/forum/w[^"]+/([^/"]+)', html)`
[baidu] support tieba videos and images 2015-10-20 01:52:06 +03:00			`urls = ['http://imgsrc.baidu.com/forum/pic/item/' + i`
			`for i in set(items)]`

[baidu] support tieba albums 2015-10-21 01:09:31 +03:00			`# handle albums`
[baidu] fix tieba albums 2016-01-07 00:33:34 +03:00			`kw = r1(r'kw=([^&]+)', html) or r1(r"kw:'([^']+)'", html)`
			`tid = r1(r'tid=(\d+)', html) or r1(r"tid:'([^']+)'", html)`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`album_url = 'http://tieba.baidu.com/photo/g/bw/picture/list?kw=%s&tid=%s' % (`
			`kw, tid)`
[baidu] support tieba albums 2015-10-21 01:09:31 +03:00			`album_info = json.loads(get_content(album_url))`
			`for i in album_info['data']['pic_list']:`
Add Baidu Cloud support 2016-10-14 09:03:56 +03:00			`urls.append(`
			`'http://imgsrc.baidu.com/forum/pic/item/' + i['pic_id'] + '.jpg')`
[baidu] support tieba albums 2015-10-21 01:09:31 +03:00
[baidu] support tieba videos and images 2015-10-20 01:52:06 +03:00			`ext = 'jpg'`
[baidu] support tieba albums 2015-10-21 01:09:31 +03:00			`size = float('Inf')`
[baidu] support tieba videos and images 2015-10-20 01:52:06 +03:00			`print_info(site_info, title, ext, size)`

			`if not info_only:`
			`download_urls(urls, title, ext, size,`
			`output_dir=output_dir, merge=False)`

Add Baidu Cloud support 2016-10-14 09:03:56 +03:00
			`def baidu_pan_download(url):`
			`errno_patt = r'errno":([^"]+),'`
			`refer_url = ""`
			`fake_headers = {`
			`'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8',`
			`'Accept-Charset': 'UTF-8,*;q=0.5',`
			`'Accept-Encoding': 'gzip,deflate,sdch',`
			`'Accept-Language': 'en-US,en;q=0.8',`
			`'Host': 'pan.baidu.com',`
			`'Origin': 'http://pan.baidu.com',`
			`'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:13.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2500.0 Safari/537.36',`
			`'Referer': refer_url`
			`}`
			`if cookies:`
			`print('Use user specified cookies')`
			`else:`
			`print('Generating cookies...')`
			`fake_headers['Cookie'] = baidu_pan_gen_cookies(url)`
			`refer_url = "http://pan.baidu.com"`
			`html = get_content(url, fake_headers, decoded=True)`
			`isprotected = False`
			`sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(`
			`html)`
			`if sign == None:`
			`if re.findall(r'\baccess-code\b', html):`
			`isprotected = True`
			`sign, timestamp, bdstoken, appid, primary_id, fs_id, uk, fake_headers, psk = baidu_pan_protected_share(`
			`url)`
			`# raise NotImplementedError("Password required!")`
			`if isprotected != True:`
			`raise AssertionError("Share not found or canceled: %s" % url)`
			`if bdstoken == None:`
			`bdstoken = ""`
			`if isprotected != True:`
			`sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(`
			`html)`
			`request_url = "http://pan.baidu.com/api/sharedownload?sign=%s&timestamp=%s&bdstoken=%s&channel=chunlei&clienttype=0&web=1&app_id=%s" % (`
			`sign, timestamp, bdstoken, appid)`
			`refer_url = url`
			`post_data = {`
			`'encrypt': 0,`
			`'product': 'share',`
			`'uk': uk,`
			`'primaryid': primary_id,`
			`'fid_list': '[' + fs_id + ']'`
			`}`
			`if isprotected == True:`
			`post_data['sekey'] = psk`
			`response_content = post_content(request_url, fake_headers, post_data, True)`
			`errno = match1(response_content, errno_patt)`
			`if errno != "0":`
			`raise AssertionError(`
			`"Server refused to provide download link! (Errno:%s)" % errno)`
			`real_url = r1(r'dlink":"([^"]+)"', response_content).replace('\\/', '/')`
			`title = r1(r'server_filename":"([^"]+)"', response_content)`
			`assert real_url`
			`type, ext, size = url_info(real_url, faker=True)`
			`title_wrapped = json.loads('{"wrapper":"%s"}' % title)`
			`title = title_wrapped['wrapper']`
			`logging.debug(real_url)`
			`print_info(site_info, title, ext, size)`
			`print('Hold on...')`
			`time.sleep(5)`
			`return real_url, title, ext, size`


			`def baidu_pan_parse(html):`
			`sign_patt = r'sign":"([^"]+)"'`
			`timestamp_patt = r'timestamp":([^"]+),'`
			`appid_patt = r'app_id":"([^"]+)"'`
			`bdstoken_patt = r'bdstoken":"([^"]+)"'`
			`fs_id_patt = r'fs_id":([^"]+),'`
			`uk_patt = r'uk":([^"]+),'`
			`errno_patt = r'errno":([^"]+),'`
			`primary_id_patt = r'shareid":([^"]+),'`
			`sign = match1(html, sign_patt)`
			`timestamp = match1(html, timestamp_patt)`
			`appid = match1(html, appid_patt)`
			`bdstoken = match1(html, bdstoken_patt)`
			`fs_id = match1(html, fs_id_patt)`
			`uk = match1(html, uk_patt)`
			`primary_id = match1(html, primary_id_patt)`
			`return sign, timestamp, bdstoken, appid, primary_id, fs_id, uk`


			`def baidu_pan_gen_cookies(url, post_data=None):`
			`from http import cookiejar`
			`cookiejar = cookiejar.CookieJar()`
			`opener = request.build_opener(request.HTTPCookieProcessor(cookiejar))`
			`resp = opener.open('http://pan.baidu.com')`
			`if post_data != None:`
			`resp = opener.open(url, bytes(parse.urlencode(post_data), 'utf-8'))`
			`return cookjar2hdr(cookiejar)`


			`def baidu_pan_protected_share(url):`
			`print('This share is protected by password!')`
			`inpwd = input('Please provide unlock password: ')`
			`inpwd = inpwd.replace(' ', '').replace('\t', '')`
			`print('Please wait...')`
			`post_pwd = {`
			`'pwd': inpwd,`
			`'vcode': None,`
			`'vstr': None`
			`}`
			`from http import cookiejar`
			`import time`
			`cookiejar = cookiejar.CookieJar()`
			`opener = request.build_opener(request.HTTPCookieProcessor(cookiejar))`
			`resp = opener.open('http://pan.baidu.com')`
			`resp = opener.open(url)`
			`init_url = resp.geturl()`
			`verify_url = 'http://pan.baidu.com/share/verify?%s&t=%s&channel=chunlei&clienttype=0&web=1' % (`
			`init_url.split('?', 1)[1], int(time.time()))`
			`refer_url = init_url`
			`fake_headers = {`
			`'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8',`
			`'Accept-Charset': 'UTF-8,*;q=0.5',`
			`'Accept-Encoding': 'gzip,deflate,sdch',`
			`'Accept-Language': 'en-US,en;q=0.8',`
			`'Host': 'pan.baidu.com',`
			`'Origin': 'http://pan.baidu.com',`
			`'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:13.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2500.0 Safari/537.36',`
			`'Referer': refer_url`
			`}`
			`opener.addheaders = dict2triplet(fake_headers)`
			`pwd_resp = opener.open(verify_url, bytes(`
			`parse.urlencode(post_pwd), 'utf-8'))`
			`pwd_resp_str = ungzip(pwd_resp.read()).decode('utf-8')`
			`pwd_res = json.loads(pwd_resp_str)`
			`if pwd_res['errno'] != 0:`
			`raise AssertionError(`
			`'Server returned an error: %s (Incorrect password?)' % pwd_res['errno'])`
			`pg_resp = opener.open('http://pan.baidu.com/share/link?%s' %`
			`init_url.split('?', 1)[1])`
			`content = ungzip(pg_resp.read()).decode('utf-8')`
			`sign, timestamp, bdstoken, appid, primary_id, fs_id, uk = baidu_pan_parse(`
			`content)`
			`psk = query_cookiejar(cookiejar, 'BDCLND')`
			`psk = parse.unquote(psk)`
			`fake_headers['Cookie'] = cookjar2hdr(cookiejar)`
			`return sign, timestamp, bdstoken, appid, primary_id, fs_id, uk, fake_headers, psk`


			`def cookjar2hdr(cookiejar):`
			`cookie_str = ''`
			`for i in cookiejar:`
			`cookie_str = cookie_str + i.name + '=' + i.value + ';'`
			`return cookie_str[:-1]`


			`def query_cookiejar(cookiejar, name):`
			`for i in cookiejar:`
			`if i.name == name:`
			`return i.value`


			`def dict2triplet(dictin):`
			`out_triplet = []`
			`for i in dictin:`
			`out_triplet.append((i, dictin[i]))`
			`return out_triplet`

add support for Baidu Music (with lyrics), fix #1 2013-03-26 09:51:37 +04:00			`site_info = "Baidu.com"`
			`download = baidu_download`
			`download_playlist = playlist_not_supported("baidu")`