Преглед на Semalt - Получаване на персонализиран скрепер за анализ на връзки

Като експерт по оптимизация на търсачките ми идват много въпроси, но нямам прости решения, за да ги адресирам. Повечето от тях са за профилиране на списъци с URL адреси въз основа на информацията, съдържаща се в съдържанието на страницата. Затова реших да използвам Google Персонализираната търсачка, въпреки че не предлага пълно решение. Някои от решенията, които бих искал да автоматизирам, включват напълно:

  • Прекъсване на връзката на мрежата
  • Създаване на набор от ключови думи, използвани за изследване на ключови думи
  • Оценка на уместността на свързването на URL адреси
  • Получаване на източници на връзка от конкретни CMS системи
  • Майнинг за уеб блогъри, специализирани в определена ниша
  • Проследяване на съдържанието за вграждане

Пътуването започна от разработването на основен скрепер, който да се използва като доказателство за концепция за по-сложен анализ на връзката. Използването на Caveats, което е по-скоро инструмент на концепцията, а не полиран инструмент, изисква технически и програмни умения за пълно предимство. Неговата скалируема ефективност може да бъде разширена от всеки експерт по програмиране.

Като изградител на връзки, би било необходимо да изляза с подробен списък на блогърите в ниша, свързваща моите противници. Те включват блогове, към които мога да се насоча към гостуващи блогове, коментиране, поставяне на съдържание и социални мрежи. Използването на инструмент като Open Site Explorer ви предлага изхода за свързване на домейни, но не предоставя конкретни данни за съдържанието на домейните.

Идентифицирането на сайт чрез надежден скрипт е първата стъпка. Започва с генераторния изход, който се създава от множество СМ. Други проверки са включени, докато го изграждате.

Инструментът обработва списък с връзки и определя неговата CMS, извежда суровите данни в CSV, като същевременно поддържа OSE данните непокътнати. Инструментът ще работи през всички URL адреси, кешира съдържанието и анализира изходния код

Намиране на блогове

Първоначалната настройка улеснява намирането на блогове, свързващи към destilled.co.uk. Това е съществен момент за откриване на нови блогове. Възможно е да компилирате изходи от асортирани противници и да проверите кръстосано всички свързващи домейни, за да получите връзки за вашата основна ниша.

Допълнителни приложения за CMS

Съществуват други стъпки за идентифициране на CMS, като например входни целеви страници, теми и папки на администратор. Може да бъде разработена добре надеждна система, която да помогне за идентифициране на CMS, поддържащ уебсайт. Полезно е по следните причини.

  • Намиране на форуми
  • Намиране на социална CMS
  • Намиране на уебсайтове на уикито
  • Получаване на връзка за следване
  • Капки за връзка

Можете също така да проверите възприемането на вграждания, джаджи на сайта и други инфографики. Това е по-добре проследено чрез настройка на сигнали, разширено търсене и физическо разпращане във връзка с профил.

Проверка на уместността на връзката - изходните връзки предлага основна информация като URL и заглавието. Тя няма друго значение.

Други задачи, които може да изпълнява, включват следното:

  • Намиране на връзки към директория
  • Майнинг за социални акаунти като Facebook и Twitter
  • Извличане на имейл адреси
  • Проверка за сайтове на Adsense, които осигуряват приходи
  • Оценка на качествата на връзките и на спама