[universal] call embed_download only if content_type is text/html (#1369)

2025-01-24 05:55:02 +03:00 · 2016-08-26 19:27:40 +02:00 · 2016-08-26 19:27:40 +02:00 · 6fc2cc375e
commit 6fc2cc375e
parent 099cd3e1a4
1 changed files with 7 additions and 7 deletions
--- a/src/you_get/extractors/universal.py
+++ b/src/you_get/extractors/universal.py
@ -6,20 +6,20 @@ from ..common import *
 from .embed import *
 def universal_download(url, output_dir='.', merge=True, info_only=False, **kwargs):
-    try:
+    content_type = get_head(url, headers=fake_headers)['Content-Type']
-        embed_download(url, output_dir, merge=merge, info_only=info_only)
+    if content_type.startswith('text/html'):
-    except: pass
+        try:
-    else: return
+            embed_download(url, output_dir, merge=merge, info_only=info_only)
        except: pass
        else: return
    domains = url.split('/')[2].split('.')
    if len(domains) > 2: domains = domains[1:]
    site_info = '.'.join(domains)
    response = get_response(url, faker=True)
    content_type = response.headers['Content-Type']
    if content_type.startswith('text/html'):
        # extract an HTML page
        response = get_response(url, faker=True)
        page = str(response.data)
        page_title = r1(r'<title>([^<]*)', page)