Merge branch 'pinterest' into develop (close #744)

2025-02-02 16:24:00 +03:00 · 2015-11-10 03:44:25 +01:00 · 2015-11-10 03:44:25 +01:00 · 312bfc9b8c
commit 312bfc9b8c
parent 87121a3a26 f44a995366
3 changed files with 49 additions and 0 deletions
--- a/src/you_get/common.py
+++ b/src/you_get/common.py
@ -47,6 +47,7 @@ SITES = {
    'mtv81'      : 'mtv81',
    '7gogo'      : 'nanagogo',
    'nicovideo'  : 'nicovideo',
    'pinterest'  : 'pinterest',
    'pixnet'     : 'pixnet',
    'pptv'       : 'pptv',
    'qianmo'     : 'qianmo',
--- a/src/you_get/extractors/init.py
+++ b/src/you_get/extractors/init.py
@ -40,6 +40,7 @@ from .mtv81 import *
 from .nanagogo import *
 from .netease import *
 from .nicovideo import *
 from .pinterest import *
 from .pixnet import *
 from .pptv import *
 from .qianmo import *
--- a/src/you_get/extractors/pinterest.py
+++ b/src/you_get/extractors/pinterest.py
@ -0,0 +1,47 @@
 #!/usr/bin/env python
 from ..common import *
 from ..extractor import VideoExtractor
 class Pinterest(VideoExtractor):
    # site name
    name = "Pinterest"
    # ordered list of supported stream types / qualities on this site
    # order: high quality -> low quality
    stream_types = [
        {'id': 'original'}, # contains an 'id' or 'itag' field at minimum
        {'id': 'small'},
    ]
    def prepare(self, **kwargs):
        # scrape the html
        content = get_content(self.url)
        # extract title
        self.title = match1(content,
                            r'<meta property="og:description" name="og:description" content="([^"]+)"')
        # extract raw urls
        orig_img = match1(content,
                         r'<meta itemprop="image" content="([^"]+/originals/[^"]+)"')
        twit_img = match1(content,
                          r'<meta property="twitter:image:src" name="twitter:image:src" content="([^"]+)"')
        # construct available streams
        if orig_img: self.streams['original'] = {'url': orig_img}
        if twit_img: self.streams['small'] = {'url': twit_img}
    def extract(self, **kwargs):
        for i in self.streams:
            # for each available stream
            s = self.streams[i]
            # fill in 'container' field and 'size' field (optional)
            _, s['container'], s['size'] = url_info(s['url'])
            # 'src' field is a list of processed urls for direct downloading
            # usually derived from 'url'
            s['src'] = [s['url']]
 site = Pinterest()
 download = site.download_by_url
 # TBD: implement download_playlist