<
  • Главная
Статьи

Як створити фільми онлайн - покрокова інструкція та видеоурок: Сайтобаза

  1. Крок перший - пошук відповідного донора
  2. Наступним кроком буде власне парсинг цього сайту
  3. Крок три - обробка контенту онлайн фільмів
  4. Назва фільму
  5. Дивитися такий-то фільм онлайн

Мене практично кожен день просять створити сайт по онлайн фільмів та серіалів. Природно контент копіпаст, так як писати опису до тисяч фільмів буде дуже і дуже дорого.

Попит на послугу дуже великий, а часу у мене катастрофічно мало, тому я вирішив створити цю інструкцію.

Трохи теорії. Для нормального функціонування онлайн-кінотеатру потрібно власне база фільмів. Базу можна:

  • Створити самому. Потрібно накачати фільмів, перетиснути їх в формат .flv (можна і не віджимати, але тоді буде витрата трафіку більше). Залити це все до себе на хостинг і роздавати. Витрати тільки на хостинг будуть в межах $ 150 / місяць. Звичайно і прибуток буде зовсім інший
  • Використовувати сторонні розширення для перегляду фільмів онлайн з торрентів. наприклад ось це . Але тоді користувачам потрібно встановити розширення для браузера, а вони на це дуже рідко погоджуються. Хоча плюсів у цього рішення дуже і дуже багато.
  • Брати контент у інших сайтів - інших онлайн кінотеатрів, хостингів відео - рутуб, вконтакте ... Природно якщо людина просить скопіювати онлайн фільми, так він і не думати до них контент, тому беремо відразу і опис фільмів, і постер, і скріншоти.

У цій інструкції я вам покажу як зібрати фільми з трьох різних джерел, привести все в божеський вид і розмістити у себе на сателітах. Тобто йдемо за третім варіантом. Буду показувати на прикладі платних інструментів, в майбутньому я зроблю подібну інструкцію, за допомогою якої можна буде зробити абсолютно безкоштовно сайт з онлайн фільмами. Отже, нам знадобиться:

  • парсер контенту Content Downloader ;
  • Програма для обробки і імпорту контенту в движки зеброїда ;
  • Якщо що потрібно буде ще - напишу в міру необхідності.

Отже, поїхали:

Крок перший - пошук відповідного донора

Сайтів з онлайн фільмами в інтернетах дуже багато, але багато хто з них зроблені з помилками, маю недоліки і захист. Тому шукати будемо дуже уважно. Кинувши клич в google, я отримав подібного роду картину

Розглянемо детальніше які пропозиції є:

  1. http://zonakino.net/ - гарний сайт, але недоліки - всього 540 фільмів і фільми зберігаються на сторонньому сервері, так що скоріше за все варто захист, і на нашому домені фільми простий оне будуть відтворюватися.
  2. http://tvbest.com.ua/ - 3953 записи. Але подивившись вихідний код сторінки, я виявив що плеєр використовує якийсь додатковий код для перегляду, значить швидше за все варто захист від таких хитрунів як ми
  3. http://novinkikino.net/ - 16 сторінок по 10 записів. Мало контенту. Плюс побіжно переглянувши пару записів, я побачив велику кількість реклами. Невже нам таке сміття
  4. http://onlainfilm.ucoz.ua/ - 6962 записи. Переконливо, правда скільки з них робітників? Правда варто захист
  5. ...
  6. сподобався мені http://www.kinopolus.ru/ - багато контенту, багато різних джерел для перегляду серіалів і що дуже зручно - багато фільмів розміщуються на серверах vkontakte.ru - надійність і швидкість роботи.

До нього я вибрав ще кілька подібних сайтів. Щоб ви повністю не копіювали мою роботу - виберете таких донорів самі.

Зроблю короткий відступ і розповім як я: [wpspoiler name = "Визначаю кількість записів"] Варіант раз - більшість сайтів зроблені на DLE, у цього движка при установці пропонується варіант ЧПУ тип2. Що значить що в URL адресі сторінки крім транслітерувати заголовка статті вказується також ID записи. І чим більше цей ID - тим більше записів. На сайті з 6 прикладу у нас останній запис має ID 15447 - що означає що на сайті є (або було) 15447 статей. Що дуже навіть ок. Подібна фішка є у багатьох двигунів. Потрібна буде допомога - в коменти. Варіант два - дивіться в футере сайту нумерацію сторінок. На нашому прикладі 946 сторінок. Множимо на 10 записів на сторінці - отримуємо вже 9460 - приблизно стільки (+/- 10) статей з фільмами на цьому донора. [/ Wpspoiler] [wpspoiler name = "Дивлюся на якому сервері розміщені фільми"] Цьому ви навчитеся дуже швидко. Наприклад фільми, розміщені на Вконтакте, помітні відразу. ось інтерфейс вконтакстовского плеєра, зліва внизу написано) Ну а вобще я заходжу на сторінку з плеєром і дивлюся вихідний код сторінки (ctrl + U) і дивимося розташування файлик з відео. Ось як на цій сторінці буде виглядати . З власного досвіду я вже знаю що скоріше за все файли доступні для перегляду тільки з цього домену. Якщо ви сумніваєтеся - збережіть сторінку на диск, і відкрийте. Якщо буде відображатися відео - значить все ок, в іншому випадку - шукайте іншого донора [/ wpspoiler]

Наступним кроком буде власне парсинг цього сайту

Показувати я буду по скриншотам, а внизу розбирати польоти

  1. Це стартовий адресу, на основі якого ми будемо генерувати всі сторінки. Спочатку адреса сторінки був http://www.kinopolus.ru/ 13724 -brak-po-zaveshhaniyu.html. З огляду на особливості ЧПУ CMS DLE, я знаю що ці цифри id статті, і якщо поставити іншу цифру - відкриється інша стаття (якщо вона існує). На місці цифри я поставив змінну {num}, генерувати будемо в 5-6 пункті
  2. "Парс задані частини документа", "Використовувати шаблон виводу". Ці пункти ми налаштуємо за наступними скриншотам.
  3. Прибираємо галочку "Завантажувати зображення". Вони нам зараз не потрібні, тільки зайвий сміття на вінчестері, і як наслідок при великих обсягах - гальмування.
  4. Вкажіть зручний шлях, куди зберігати файло. Під кожен проект я створюю окрему папочку, так зручніше потім шукати.
  5. Тут вказуємо першу і останню цифру, яку програма повинна підставляти замість {num}. А {num} - ми задали в тому місці, де CMS DLE підставляв id записи. Зрозуміло, або пояснити детальніше?
  6. Ну і кнопочка собсно запуску генератора сторінок для парсинга

Ну от і все. Тепер потрібно задати що парсити на конкретних сторінках. Отже, тиснемо кнопочку біля пункту # 2, навпроти "Парс задані частини документа". Отримуємо ось таку картину

  1. Це власне задаємо кордону парсинга. Задати кордону - значить вибрати які елементи на сторінці нам потрібні. Адже всю сторінку з усім сміттям нам не потрібно, правди? Потрібен тільки контент, який включає в себе - назва статті, опис фільму і сам фільм. Також непогано було б отримати категорію, в якій цей фільм є
  2. Це, власне кажучи, кнопочка для завдання кордонів, натиснувши на неї - потрапляємо в чудовий світ сторінки всередині - вихідного коду сторінки. Про це трохи нижче.
  3. Ну і третій пункт - настройка одержуваного результату. Його ми будемо робити як задамо кордону парсинга.

Отже, тиснемо другу кнопочку і отримуємо:

  1. Насамперед потрібно включити браузер. Він з'явиться в нижній частині панелі (на скріншоті він вже включений). З браузером нам буде легше орієнтуватися
  2. Отже для початку ми вибираємо де у нас знаходиться заголовок статті. Можна просто клацнути на елементі внизу, і КД автоматом вас перекине до потрібного коду (там де # 4 і # 6).
  3. Ще можна виділити шматок тексту і скопіювавши його потрапляємо в меню пошуку по html коду, ну це в тому випадку, якщо пункт 2 вам не допоміг знайти потрібний елемент.
  4. Як бачимо, біля заголовка статті зліва і справа стоїть html код. Так як це движок, і форматування у кожної сторінки повинно бути однакове, ми, включаючи логіку, розуміємо що той код який зліва ми можемо використовувати для завдання початку парсинга
  5. Ось тут задаємо початок парсинга. Просто виділяємо елемент з # 4, і тиснемо кнопочку 5
  6. За аналогією з четвіркою - код справа - що закриває тайтл, значить його можна використовувати для завдання кінця кордону парсинга
  7. Ось в цьому пунктик
  8. На даний момент Content Downloader підтримуємо 20 звичайних кордонів парсинга. Щоб не плутатися - запам'ятаємо (або запишемо), що межа парсинга # 1 у нас відповідає за заголовок статті
  9. Зберігаємо налаштування цієї сторінки і переходимо до завдання кордонів парсинга # 2

Щоб не плутатися - запам'ятаємо (або запишемо), що межа парсинга # 1 у нас відповідає за заголовок статті   Зберігаємо налаштування цієї сторінки і переходимо до завдання кордонів парсинга # 2

  1. Я задав кордону по етоу елементу
  2. Так як бачу візуально що він найближче до тематичної частини, після нього відразу йде картинка і власне текст
  3. Хоча можливо було правильніше чіпляти за цей елемент, так як він нормально виражений в html коді, і скоріше за все не змінюється на інших сторінках. Але все ж в я ризикну - потім роботи буде менше з очищення контенту від сміття
  4. А тут я поступив зовсім навпаки, поставив по закінченню посту - ну якщо уважно подивитися на html код сторінки включивши логіку і зрозумівши англійське слово "post-data"
  5. Хоча логічніше було б задати по початку цього дива, і позбутися від купи сміття (# 6), але я не впевнений в цьому діві, можливо він є тільки на декількох сторінках

По суті у нас вже є заголовок, і є стаття з відео. Нижче 4 пункту можна побачити що є і категорія. Я задаю її в межах парсинга # 3.

Тиснемо готове справа внизу і переходимо до "шаблонами виведення"

Тут все досить просто. Тут задається шаблон, за яким буде виводиться результат. Як ми пам'ятаємо - межа # 1 у нас заголовок статті, межа # 2 - сама стаття і # 3 - рубрика. Що б зручніше було імпортувати в зеброїда і не втрачати структури документа я поставив на перше місце рубрику, потім назва фільму і опис фільму з самим фільмом.

У зеброїда стандартний імпорт з html сторінки спрацює і зрозуміє мою структуру. Головне - назва категорії виділити тегом H1, а назва статті виділити тегом H2. тоді все буде ок;)

Ну що ж, тиснемо "Готово", переходимо на головне вікно, зберігаємо проект (обов'язково зберігайте, раптом що не так - що б потім швидко можна було переробити). Ну і стартуйте. Через деякий час весь сайт Спарс в безліч окремих файлів, готових до імпорту в зеброїда.

Крок три - обробка контенту онлайн фільмів

Ну тут можна залишити мої стандартні настройки.

Якщо ж у вас зеброїда зі стандартного набору, не забудьте додати на вкладці "Пост обробка" додати в список виключення більше тегів, а то отримаєте замість контенту з фільмами трохи так кашу;)

І ось, ми імпортували (у вас там буде багато більше записів, але мені для показу буде досить і цього). І у нас вийшов повний звіздець.

І у нас вийшов повний звіздець

Як бачимо - зеброїда правильно розпізнав де у нас рубрика, а де стаття. Але сам перегляд фільму додав в новостворену категорію.

[Wpspoiler name = "Це сталося тому ..."] Та все дуже просто - раз зеброїда створив нову категорію, значить щось виділялося тегом H2 в статті. А виділялася напис перед самим плеєром "Перегляд фільму такого-то". Разом у нас вийшло стаття виду

Назва фільму

Опис фільму, всі справи ...

Дивитися такий-то фільм онлайн

Коди плеєрів фільмів Зрозуміло що такі справи нас не влаштовують. Думаю в найближчому часі таку біду унеможливлять в зеброїда, але поки немає апдейта - я покажу як виходжу з ситуації я. Трохи нижче;) [/ wpspoiler]

Нас це нихт не влаштовує. Для вирішення питання ми будемо застосовувати сучасні нанотехнології і кмітливість. Ну звичайно нам ще знадобиться відмінна софтинка з очищення тексту - [download id = "9"].

Потрібно буде - як-то розпишу функціонал і можливості. Зараз же скажу коротко - програма дозволяє візуально налаштувати роботу регулярних виразів і так фільтрувати і чистити текст, що ви і ніколи і не думали про таких можливостей. Програма російськомовна, раджу хоча б мигцем глянути весь функціонал. Зараз же нам знадобиться пошук / заміна. [Wpspoiler name = "Завдання"] Є дублювання тегів в одному окремо взятому файлі. Перші теги h1, h2 у нас йдуть правильно, потмо в статті домішувати зайві теги h1 і h2, які ламають структуру. Потрібно - прибрати все теги h1 і h2 крім перших. [/ Wpspoiler] [wpspoiler name = "Рішення"] Перейменувати все теги h1 в h3, а h2 в h4. Потім перейменувати тільки перший тег h3 назад в h1, аналогічно вчинити з h4. Тільки перший тег! [/ Wpspoiler]

Рішення візуально я зроблю в відео. Ця проблема, я сподіваюся, буде усунена в найближчих версіях зеброїда.

Ну і далі я займуся банальної очищенням контенту і приведення ось цього сміття

з ось таким ось зовнішнім виглядом

в ось таку красу за кодом

яка буде виглядати ось так (там де недовантаження картинка - там плеєр, з ним все ок, просто не відображається)

Після того як я почищу контент, я проводжу такі процедури:

  • Додам мітки (ключові слова) до кожного запису. Це дозволить трохи оптимізувати сторінку з контентом (адже вони у нас будуть прописані в метатегах)
  • Зробити внутрішню перелинковку всередині сайту по частоупотребляемим ключовими словами, що підвищить швидкість індексації сайту, розподілить і дасть більше ваги внутрішнім сторінкам і як наслідок - підніме по НЧ запитам
  • Додам планування публікацій за часом - це створить видимість робочого, постійно поповнюється сайту, без будь-яких рухів тіла з нашого боку
  • Скачаю все зображення до себе на хостинг. Це дозволить виключити видалення картинок з сайту-донора і не дозволить зіпсувати зовнішній вигляд статей нашого онлайнкінотеатра
  • Можливо додам ще коментарии в автоматичному режимі - це створить видимість нормального, живого сайту
  • Заллю на якийсь популярний движок, скоріше за все CMS DLE
  • Ну і заллю на безкоштовний хостинг - ucoz

У підсумку ми отримуємо відмінний сайт з онлайн фільмами, яких і так вже величезна кількість, але які все продовжують приносити дохід своїм власникам.

Як ви бачите з уроку - маючи в руках потрібний софт і володіючи мінімумом знань можна за кілька годин створити самому відмінний сайт онлайн фільмів. Темболее що Напарс контенту з 5-7 донорів і перемішавши його, можна отримати десяток хороших трафікопріносящіх сателітів. Це забере у вас максимум дві доби часу.

Ну а ті хто ледачий, або якому не хочеться вивчати ці програми я можу запропонувати створення сайтів з онлайн фільмами. Як ви вже зрозуміли - я розумію що я роблю. Вартість сайту на новому контенті (я ніколи не використовую для різних клієнтів один і той же контент) на 3.000 статей коштує $ 30, а на 5.000 всього $ 40.

В цю ціну входить:

  • Установка зручного вам движка
  • Всі потрібні роботи по контенту (що я описував вище)
  • Підбір паблік шаблону і мінімальне приведення його в божеський вид, Унікалізація (мінімально)

Кому дуже треба - за додаткову плату я можу допомогти з дизайном і версткою вашого шаблону, а також допомогти з пошуковою оптимізацією.

Всі питання з роботою зеброїда і КонтентДаунлоадера можна задати у відповідних статтях, в коментарях до цього запису. а також будь-яким, зручним для вас способом зв'язку зі мною .

Переконливо, правда скільки з них робітників?
Зрозуміло, або пояснити детальніше?
Адже всю сторінку з усім сміттям нам не потрібно, правди?


Новости
  • Виртуальный хостинг

    Виртуальный хостинг. Возможности сервера распределяются в равной мере между всеми... 
    Читать полностью

  • Редизайн сайта

    Редизайн сайта – это полное либо частичное обновление дизайна существующего сайта.... 
    Читать полностью

  • Консалтинг, услуги контент-менеджера

    Сопровождение любых интернет ресурсов;- Знание HTML и CSS- Поиск и обновление контента;-... 
    Читать полностью

  • Трафик из соцсетей

    Сравнительно дешевый способ по сравнению с поисковым и контекстным видами раскрутки... 
    Читать полностью

  • Поисковая оптимизация

    Поисковая оптимизация (англ. search engine optimization, SEO) — поднятие позиций сайта в результатах... 
    Читать полностью