Добрый день! Интересует готовый скрипт парсинга сайта 100СП.
Поскольку сайт большой и товаров на нем много - параметрами запроса является таблица с указанием Штрихкода товар и Наименования. Штрихкод не всегда может быть указан. Размер входной таблицы от 1 до 10000 связок наименование + ШК
Пример таблицы:
Наименование ШК
KOREAN POWER GINSENG PAD20ea Пластырь согревающий с женьшенем для суставов 8809158800232
KOREAN GLU RED GINSENG GREENON Лечебный пластырь с глюкозамином и красным женьшенем 20ea 8809158801192
RECELL WRINKLE CARE TAPE Тейпы против морщин (20 патчей) 8809261002158
ENOUGH W COLLAGEN WHITENING PREMIUM EYE CREAM Осветляющий крем с коллагеном для век, 30 мл 8809280061464
ENOUGH COLLAGEN MOISTURE FOUNDATION SPF15 Увлажняющий тональный крем с коллагеном #13, 100 ml 8809280062362
ENOUGH COLLAGEN MOISTURE FOUNDATION SPF 15 Увлажняющий тональный крем с коллагеном #21, 100 ml 8809280062379
Пример запроса поиска по ШК 8809809800239
https://www.100sp.ru/search?query=8809809800239
Пример запроса поиска по наименованию ENOUGH W COLLAGEN WHITENING PREMIUM EYE CREAM Осветляющий крем с коллагеном для век, 30 мл
Необходимые к выгрузке элементы с примером кода с элементов страницы:
1) Уникальный код товара на сайте data-item-id="679411821"
2) Наименование data-item-details="ENOUGH W COLLAGEN WHITENING PREMIUM EYE CREAM Осветляющий крем с коллагеном для век, 30 мл"
3) количество заказов class="orders"
4) Тип покупки на сайте rich-title "Быстрая покупка со сроком доставки до 2 дней..." варианты покупки Быстрая=Истина, период доставки = 2 дня
5) Цена до скидки discounted-price
6) Цена текущая new-price или просто price (если нет цены до скидки)
7) Фото товара image src="https://cdn.100sp.ru/cache_pictures/176898311/thumb300"
8) имя организатора class="org-name"
9) рейтинг организатора class="org-rating full"
Среди найденных позиций интересуют только те, что по наименованию совпадают хотя бы на 60% (неявное сличение с использованием перестановки слов и транслитерации), либо полное соответствие по ШК
На сайте есть фильтр по содержимому, что не позволяет неавторизированному пользователю видеть часть информации. Но даже после успешной авторизации есть продукция, которая доступна только покупателям с хорошим рейтингом. Рейтинг можно заработать только при хорошей истории покупок на сайте. Есть продукция, которую "обычные" или "новички" не видят. Следовательно должна быть авторизация. Ранее парсинг сайта был написан на 1С и выполнялся ночью, но после изменений на сайте перестал работать. Сайт не дает выполнять много частых запросов, следовательно необходима возможность установки периодичности запросов. Точных данных по ограничению запросов не получено, только тестированием можно определить.
Гарантии | Бесплатные доработки |
Комиссия | 0% |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Система оплаты | Безопасная сделка |