Користувач:Георгій Корж/Скрепі

Scrapy
Тип	Web crawler
Розробник	Zyte (formerly Scrapinghub)
Перший випуск	26 червня 2008
Стабільний випуск	2.11.0 (18 вересня 2023)
Операційна система	Windows, macOS, Linux
Мова програмування	Python
Ліцензія	BSD License
Репозиторій	https://github.com/scrapy/scrapy
Вебсайт	scrapy.org

Не плутати з Scrapie.

Scrapy ( ([ˈskreɪpaɪ] "скрейпай", також, часто вживається "скрепі" ) — це безкоштовна платформа для веб-сканування (збору даних у вебі) з відкритим кодом, написана на Python. Хоча її було спроєктовано для вебсрепінгу, її також можна використовувати для вилучення даних за допомогою API або як веб-сканер (пошуковий робот) загального призначення. ^[1] Наразі він підтримується компанією Zyte (раніше Scrapinghub ), яка займається розробкою та послугами вебскрепінгу.

Архітектура проєкту Scrapy побудована навколо «павуків» ("spiders"), які є самодостатніми сканерами та отримують набір інструкцій. Дотримуюється духу «не повторюйся» (DRY — don't repeat yourself) інших фреймворків, таких як Django ^[2], що полегшує створення та масштабування великих проєктів-сканерів, дозволяючи розробникам повторно використовувати свій код.

Деякі відомі компанії та продукти, які використовують Scrapy: Lyst, ^[3] ^[4] Parse.ly, ^[5] Sayone Technologies, ^[6] Sciences Po Medialab, ^[7] Data.gov.uk 's World Government Data site . ^[8]

Історія

Scrapy було створено в лондонській компанії з веб-агрегації та електронної комерції Mydeco, де її розробили та підтримували співробітники Mydeco та Insophia (веб-консалтингова компанія, розташована в Монтевідео, Уругвай). Перший публічний випуск відбувся у серпні 2008 року за ліцензією BSD, а віха 1.0 відбулася в червні 2015 року ^[9] . У 2011 році Zyte (раніше Scrapinghub) став новим офіційним утримувачем. ^[10] ^[11]

Посилання

↑ Scrapy at a glance.
↑ Frequently Asked Questions. Frequently Asked Questions, Scrapy 2.8.0 documentation (амер.). Процитовано 28 липня 2015.
↑ Bell, Eddie; Heusser, Jonathan. Scalable Scraping Using Machine Learning. Архів оригіналу за 4 червня 2016. Процитовано 28 липня 2015.
↑ Scrapy | Companies using Scrapy
↑ Montalenti, Andrew (27 жовтня 2012). Web Crawling & Metadata Extraction in Python. Web Crawling & Metadata Extraction in Python - Speaker Deck (амер.). Процитовано 11 травня 2015.
↑ Scrapy Companies. Scrapy | Companies using Scrapy.
↑ Hyphe v0.0.0: the first release of our new webcrawler is out!
↑ Ben Firshman [@bfirsh] (4 листопада 2010). World Govt Data site uses Django, Solr, Haystack, Scrapy and other exciting buzzwords http://bit.ly/5jU3La #opendata #datastore (Твіт) — через Твіттер.
↑ Medina, Julia (19 червня 2015). Scrapy 1.0 official release out!. scrapy-users (Список розсилки).
↑ Hoffman, Pablo (2013). List of the primary authors & contributors (амер.). Процитовано 18 листопада 2013.
↑ Interview Scraping Hub.

Ознайомтеся зі списком 21 найкращого інструменту веб-збирання у 2023 році

Додати тему

[1] Scrapy at a glance.

[2] Frequently Asked Questions. Frequently Asked Questions, Scrapy 2.8.0 documentation (амер.). Процитовано 28 липня 2015.

[3] Bell, Eddie; Heusser, Jonathan. Scalable Scraping Using Machine Learning. Архів оригіналу за 4 червня 2016. Процитовано 28 липня 2015.

[4] Scrapy | Companies using Scrapy

[5] Montalenti, Andrew (27 жовтня 2012). Web Crawling & Metadata Extraction in Python. Web Crawling & Metadata Extraction in Python - Speaker Deck (амер.). Процитовано 11 травня 2015.

[6] Scrapy Companies. Scrapy | Companies using Scrapy.

[7] Hyphe v0.0.0: the first release of our new webcrawler is out!

[8] Ben Firshman [@bfirsh] (4 листопада 2010). World Govt Data site uses Django, Solr, Haystack, Scrapy and other exciting buzzwords http://bit.ly/5jU3La #opendata #datastore (Твіт) — через Твіттер.

[9] Medina, Julia (19 червня 2015). Scrapy 1.0 official release out!. scrapy-users (Список розсилки).

[list-10] Hoffman, Pablo (2013). List of the primary authors & contributors (амер.). Процитовано 18 листопада 2013.

[11] Interview Scraping Hub.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]