Logo    
Деловая газета CitCity.ru CITKIT.ru - все об Open Source Форумы Все публикации Учебный центр Курилка
CitForum    CITForum на CD    Подписка на новости портала Море(!) аналитической информации! :: CITFORUM.RU
IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

23.02.2017

Google
WWW CITForum.ru
С Новым годом!

2004 г.

Оптимизация не-HTML-сайтов для поисковых серверов

Оригинал:Search Engine Optimization and Non-HTML Sites
Автор: 2004.06.16 Алан Кнехт (Alan K'necht) и Digital Web
Перевод: 2004.07.06 Максим Россомахин, сайт www.webmascon.com

Приходится признать, что знаменитая цитата "Построй это, и они сами к тебе придут" из фильма Field of Dreams вряд ли применима для веб-сайтов. В чем толк создавать великолепный веб-сайт, если о нем никто не знает или просто не может его найти? К несчастью, это реальность для сайтов, созданных целиком на Flash.

Речь идет не только о сайтах, сделанных целиком на Flash. Множество сайтов содержит всевозможные виды материалов, которые только можно придумать. Вспомните обо всех этих PDF аудио и мультимедиа файлах. Может ли этот контент быть проиндексирован поисковиками? Ответ - и да и нет.

С какой стати беспокоиться о поисковиках? С момента появления Yahoo (в начале всего лишь простой каталог сайтов) много лет назад и самых первых поисковых сервисов (WebCrawler, Infoseek, Altavista и проч.), люди используют их для нахождения специфичных сайтов с нужным им конвентом. Если ваш сайт не оптимизирован для поисковиков - вполне возможно, что люди его просто не найдут. А без посетителей вся ваша работа над сайтом пропадёт впустую.

Flash

Итак, что же нам делать? Во-первых, не делайте сайт полностью во Flash. Мне вспоминается основная идея одного доклада вице-президента Macromedia, представленного на конференции много лет назад. Думаю, его утомили обвинения в том, что Flash используют где не попадя, и он начал свой доклад с тезиса "10 причин не использовать Flash" (само собой, второй тезис рассказывал о преимуществах Flash-технологии).

Проблема

Flash стал любимым инструментом графических дизайнеров благодаря богатой палитре дизайнерских возможностей, лёгкости создания анимации, совместимости со всеми броузерами и платформами (хотя тут еще можно поспорить). Но для поисковиков flash-вставки является всего лишь графическим файлом. А мы знаем, что все поисковики анализируют текст и всегда игнорируют графику. Другая проблема состоит даже не в том, что контент Flash-страницы будет проигнорирован, а в том, что ссылки, содержащиеся в анимации, также буду проигнорированы - индексация сайта остановится на первой же странице flash-сайта.

Ошибкой создавать сайты целиком на Flash грешат не только любители, многие ведущие веб-дизайнеры с заоблачными гонорарами наступают на те же грабли. Иногда и вправду бывает, что только с помощью Flash можно получить специфический результат (например, создать интернет-игру), так что использование Flash-а в данном случае вполне оправдано - но нужен ли он вам для всего сайта?

В качестве плохого примера Грегори Маркел (Gregory Markel, Infuse Creative) приводит сайт кинокомпании, недавно открывшей веб-сайт под названием "I, Robot" (в рамках подготовки к выпуску одноименного фильма, намеченного на лето 2004 года). Достаточно взглянуть на сайт, чтобы воочию убедиться в проблеме с Flash-технологей. Маркел, будучи энтузиастом Flash, отмечает, что об этом сайте, поскольку он выполнен целиком во Flash, не знает ни один из ведущих поисковиков (на момент написания статьи). Да, студия не пожалеет денег на рекламу сайта, да и у фильма будет достаточная армия фанатов, которые будут рекламировать повсеместно ссылки на этот сайт. И тем не менее, не было бы лучше, если бы желающим найти сайт в Сети достаточно было просто зайти на любимый поисковик и набрать там название сайта?

Среди перечисленных мной преимуществ Flash я указал также и кроссбраузерность. Это верно лишь тогда, когда у пользователя установлен Flash plug-in. Несмотря на то, что Macromedia и другие оценивают распространённость Flash вплоть до 98 %, это всё ещё не гарантирует, что всякий имеет plug-in. Если пользователь слепой или слабо видит, и пользуется Брайль-ридером или голосовым браузером - а они видят тоже, что и поисковики т.е. порой просто что-нибудь типа "тут есть Flash".

Если хотите узнать, что видят эти люди (и поисковики), попробуйте взглянуть на ваш сайт старым добрым браузером Lynx. Он был создан в те времена, когда графика и Flash ещё не стали частью Сети. Посмотрите на ваш сайт. Видите его материалы? Можете перейти с одной страницы на другую? Ах да, у вас же сайт целиком на Flash.

Решение

Во-первых, ради поисковиков, если уж делаете свой сайт целиком во Flash, позаботьтесь хотя бы о хорошем заголовке страницы (элемент "title") и тексте в метатеге "description".

Во-вторых, когда будете делать ссылки, поместите на странице несколько стандартных ссылок вида <a href>. В этом случае поисковые роботы смогут проиндексировать больше одной страницы вашего сайта.

Наконец, там, где возможно, перенесите текст из Flash-ролика во внутрь старого доброго HTML. Если вам необходимо соблюсти точное положение ролика на странице - воспользуйтесь XHTML и CSS. Это метод работает во всех современных браузерах (IE 5+, Netscape 6+, Mozilla, Opera и т.д.)

PDF

О формате Adobe PDF (Portable Document Format) слышали практически все. Это отличный способ сделать так, чтобы ваш контент всегда на всех экранах выглядел одинаково и печатался так, как задумано. Проблема HTML в том, что он в отличие от PDF, был создан для просмотра браузером, а не подготовки текста к печати. PDF-файлы же можно посмотреть в любом браузере (необходим plug-in), а их содержимое великолепно выглядит на печати. Кроме того, PDF - отличное решение для публикации больших документов (например, официальных бумаг), изначально подготовленных в каком-либо текстовом редакторе.

Ещё одним преимуществом PDF можно назвать поддержку встроенных шрифтов, а так же тот факт, что файл может содержать в себе графику с гораздо более высоким разрешением, чем JPG и GIF, используемые стандартно в Сети. Это очень важно для технической документации и прочего технического материала.

Проблема

В то время как большинство ведущих поисковиков способно прочесть и проиндексировать содержимое PDF-файла, всё же существуют некоторые ограничения - поисковики могут проиндексировать лишь первые несколько сотен или тысяч символов. Кроме того, размеры PDF-файлов часто превышают 100 килобайт, что увеличивает время на их загрузку.

Решение

Во-первых, убедитесь, что в вашем PDF-файле есть текст. В противном случае к чему беспокоиться об индексировании документа, если в нет ни одного слова.

Во-вторых, точно также как и при оптимизации веб-страниц, убедитесь в том, что в вашем PDF-документе имеются ключевые слова и фразы. Выделяйте эти ключевые слова как только можно (используйте их в оглавлении, в названиях страниц и т.п.). Если вы считаете, что данные слова важны, так же будут считать и поисковые системы.

В третьих, если ваш PDF-файл слишком велик, подумайте о том, чтобы разделить его на несколько менее крупных документов. Благодаря этому из документов в базу индексации поисковиков попадет больше текста. Также попробуйте на HTML-странице написать краткий обзор того, что содержится в PDF-файле, и рядом поместите ссылку на PDF-документ.

Размер PDF-файла можно сократить еще больше, например, сократив число шрифтов, применяемых в нём. Помимо того, что размер файла уменьшится, ваш документ приобретет более строгий дизайн.

Кроме того, используйте PDF-файл как наживку. Если ваш PDF-документ очень большой, предложите начальные его страницы бесплатно для ознакомления, а затем попросите пользователя зарегистрироваться (вот вам и потенциальный клиент), чтобы получить полный документ. Так вы обращаете недостаток PDF в свое преимущество.

Аудио- и мультимедиа-файлы

Каждый из нас когда-либо выкачивал mp3-файлы из Сети. Ну а как на счёт Real Audio или Real Video файлов или других мультимедийных форматов? Есть они на вашем сайте? Возможно ли, что их кто-то упорно ищет в Сети, но не может найти? Если вы думаете, что поиск мультимедийных файлов чем-то отличается от поиска текстовых, подумайте ещё разок.

Вот уже более года я пользуюсь сайтом Singfish.com для поиска различных мультимедийных файлов. Если вы о нём ещё не слышали, не волнуйтесь, вскоре он будет обслуживать запросы различных поисковых серверов. Другие поисковики, например Alltheweb.com, вот уже несколько лет индексируют мультимедиа-файлы.

Проблема

Единственная реальная проблема с мультимедиа файлами типа Flash в том, что в них не содержится простого текста, который бы поисковики могли проиндексировать. Вторая проблема заключается в том, что создатели таких файлов совершенно не подозревают о том, что их медиа-файлы могут быть проиндексированы, а потому и не подготавливают их к этому.

Решение

Создавая мультимедийный файл, не забудьте про метаданные (ваше программное обеспечение попросит вас об этом). Заполните их эффективной и правильно структурированной информацией. По словам Карен Хау (генеральный директор Singingfish, AOL), отсутствие или неверная структура метаданных - главная причина, по которой Singingfish приходится игнорировать тот или иной материал.

Общепринятые мета-определители, которые необходимо заполнить, таковы:

  • Title (заголовок/название файла)
  • Author (автор/исполнитель)
  • Copyright (авторские права)
  • Description (описание)

Итак, давайте выясним, чем отличаются плохие метаданные от хороших:

Метаданные Неудачно В самый раз
Title my.mov Widgets and their use in HTML editing
(Хитрости редактирования html-файлов)
Copyright Моё K'nechtology Inc. © 2004
Description Файл о чем-то в формате Quicktime Визуальное руководство о хитростях редактирования HTML-кода

Закончив заполнять метаданные, позаботьтесь о том, что страница, которая ссылается на них,:

  • содержит осмысленный текст в ссылке на файл
  • может быть найдена роботом-поисковиком
  • имеет понятный заголовок

При оформлении ссылки на медиа-файл не забывайте про атрибут "title":

<embed ... title="A visual guide ..."></embed>

или

<object ... title="A visual guide ...">A visual guide ...</object>

Наконец, присваивайте вашим файлам говорящие названия. Поисковики при индексации учитывают также и имена файлов, так что старайтесь называть их как-нибудь вроде "widgets-html-editing.mov" и избегайте ни о чём не говорящих названий типа "wig1234.mov".

Поскольку поисковики сейчас, да и в ближайшем обозримом будущем, предпочитают индексировать простой текст, следуйте моим рекомендациям, и тогда ваш контент будет замечен поисковиками. В результате повысится рейтинг вашего сайта в результатах поисков. Понимая суть проблемы и следуя данным советам, вы сможете сделать ваш веб-сайт более удобным для поисковиков и заполучить посетителей, которые раньше просто не могли вас найти.

Алан Кнехт (Alan K'necht)

Alan K'necht operates K'nechtology Inc., a search engine optimization & marketing and web development company. He is also a freelance writer, project manager, and accomplished speaker at conferences throughout the world. When he's not busy working, he can be found chasing his small children or trying to catch some wind while windsurfing or ice/snow sailing.

Размещение рекламы — тел. +7 495 4119920, ICQ 232284597

Подписка на новости IT-портала CITForum.ru
(библиотека, CITKIT.ru, CitCity)

Новые публикации:

24 декабря

CITKIT.ru:

  • Новогодние поздравления
  • Сергей Кузнецов. Цикл Операционные системы: Ностальгия по будущему:

  • Алексей Федорчук. OpenSolaris 2008.11 Release

  • Сергей Голубев:

  • Евгений Чайкин aka StraNNik (Блогометки):

    17 декабря

  • С.Д.Кузнецов. Базы данных. Вводный курс

    10 декабря

    CITKIT.ru:

  • OpenSolaris 2008.11 Release

  • Альтернативные ОС: две грустные истории (С.Кузнецов)
  • Nokia N810 — доведение до ума
  • CitCity:

  • Платформа 2009: заоблачные перспективы Microsoft

    4 декабря

  • Лекция С.Д.Кузнецова Понятие модели данных. Обзор разновидностей моделей данных

    CITKIT.ru:

  • OpenSolaris 2008.11 Release. Первые впечатления

  • Linux vs FreeBSD: продолжим "Священные войны"?

  • Nokia N810 as is

  • Индульгенция для FOSS

  • Друзья СПО'2008

    26 ноября

  • Нечеткое сравнение коллекций: семантический и алгоритмический аспекты

    CitCity:

    CITKIT.ru:

  • Глава из книги А.Федорчука
    Сага о FreeBSD:
  • 19 ноября

  • Проблемы экономики производства крупных программных продуктов

  • Язык модификации данных формата XML функциональными методами

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    Заметки к книге:

  • FreeBSD: монтирование сменных устройств и механизм HAL
  • Текстовый редактор ee

    12 ноября

  • Правило пяти минут двадцать лет спустя, и как флэш-память изменяет правила (Гоц Грейф, перевод: Сергей Кузнецов)

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:
  • OSS в России: взгляд правоведа (В.Житомирский)

  • Новая статья из цикла С.Голубева "Железный марш":

    29 октября

  • О некоторых задачах обратной инженерии

  • Веб-сервисы и Ruby

  • Тестирование web-приложений с помощью Ruby

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

  • PuppyRus Linux - беседа с разработчиком (С.Голубев)

  • Сергей Кузнецов. Заметка не про Linux

    22 октября

  • Обзор методов описания встраиваемой аппаратуры и построения инструментария кросс-разработки

    CITKIT.ru:

  • Сергей Кузнецов. Почему я равнодушен к Linux

  • Глава из книги А.Федорчука
    Сага о FreeBSD:
  • Что надо иметь
    3. Базовые познания

    CitCity:

  • Управление IT-инфраструктурой на основе продуктов Microsoft

    15 октября

  • Методы бикластеризации для анализа интернет-данных

    CitCity:

  • Разъемы на ноутбуках: что они дают и зачем их так много?
  • AMD Puma и Intel Centrino 2: кто лучше?

    CITKIT.ru:

  • Новый цикл статей С.Голубева
    Железный марш:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    8 октября

  • Автоматизация тестирования web-приложений, основанных на скриптовых языках
  • Опыт применения технологии Azov для тестирования библиотеки Qt3

    Обзоры журнала Computer:

  • SOA с гарантией качества
  • Пикоджоуль ватт бережет
  • ICT и всемирное развитие

    CitCity:

  • Пиррова победа корпорации Microsoft

    CITKIT.ru:

  • Главы из книги А.Федорчука
    Сага о FreeBSD:

    Статья из архива:

  • Я живу в FreeBSD (Вадим Колонцов)

    Новые Блогометки:

  • Перекройка шаблона Blogger или N шагов к настоящему
  • Blogger. Comment style
  • Screenie или глянцевый снимок экрана

    2 октября

    CITKIT.ru:

  • Сага о FreeBSD (А. Федорчук)

    Zenwalk: пакет недели

  • Банинг — интеллектуальное развлечение (С.Голубев)

    CitCity:

    25 сентября

  • Клермонтский отчет об исследованиях в области баз данных

    CITKIT.ru:

  • Пользователям просьба не беспокоиться... (В.Попов)

  • Снова про ZFS: диск хорошо, а два лучше
  • Командная оболочка tcsh (А.Федорчук)

    Zenwalk: пакет недели

    17 сентября

  • T2C: технология автоматизированной разработки тестов базовой функциональности программных интерфейсов
  • Технология Azov автоматизации массового создания тестов работоспособности

    CITKIT.ru:

  • FreeBSD: ZFS vs UFS, и обе-две — против всех (А.Федорчук)

    Zenwalk: пакет недели

  • Дачнет — практика без теории (С.Голубев)

    10 сентября

  • За чем следить и чем управлять при работе приложений с Oracle
  • Планировщик заданий в Oracle
    (В.Пржиялковский)

    CITKIT.ru:

  • Microsoft: ответный "боян" (С.Голубев)

  • Причуды симбиоза, или снова "сделай сам" (В.Попов)

  • Файловые системы современного Linux'а: последнее тестирование
  • Zsh. Введение и обзор возможностей
    (А.Федорчук)

    Описания пакетов Zenwalk: Zsh, Thunar, Thunar-bulk-rename, Xfce4-places-plugin, Xfce4-fsguard-plugin

    Блогометки:

  • Google Chrome
  • Лончер для ASUS Eee PC 701

    3 сентября

    CITKIT.ru:

  • Заметки о ядре (А.Федорчук):

    Добавлены описания пакетов Zenwalk: Galculator, Screenshot, Gnumeric, Pidgin

    В дискуссинном клубе:

  • И еще о Википедии и Google Knol

  • Лекция для начинающего линуксоида (С.Голубев)

    26 августа

  • Транзакционная память (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • Открыт новый проект Zenwalk: пакет недели

  • Статья Текстовые процессоры и их быстродействие: конец еще одной легенды?

    21 августа

    CITKIT.ru:

  • Почему школам следует использовать только свободные программы (Ричард Столлман)
  • Беседа Сергея Голубева с учителем В.В.Михайловым

  • Википедия или Гуглезнание? Приглашение к обсуждению (Алексей Федорчук)
  • Народная энциклопедия от Google (StraNNik)

  • Обзор Mandriva 2009.0 Beta 1 Thornicrofti
  • Новичок в Линукс: Оптимизируем Mandriva 2008.1

  • Книга Zenwalk. Приобщение к Linux:

    13 августа

    CitCity:

  • Мирный Atom на службе человеку. Обзор платы Intel D945GCLF с интегрированным процессором
  • Обзор процессоров Intel Atom 230 на ядре Diamondville

  • iPhone - год спустя. Скоро и в России?

    CITKIT.ru:

  • Интермедия 3.4. GRUB: установка и настройка (из книги Zenwalk. Приобщение к Linux)

    6 августа

  • СУБД с хранением данных по столбцами и по строкам: насколько они отличаются в действительности? (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • Интермедия 2.2. Что неплохо знать для начала (из книги Zenwalk. Приобщение к Linux)

  • И снова про шрифты в Иксах (А.Федорчук)

  • 20 самых быстрых и простых оконных менеджеров для Linux

  • Дело о трех миллиардах (С.Голубев)

    30 июля

  • OLTP в Зазеркалье (Пересказ: С. Кузнецов)

    CitCity:

  • Будущее BI в облаках?
  • Тиражные приложения и заказная разработка. Преимущества для заказчика
  • Дискуссия со сторонниками заказной разработки

    CITKIT.ru:

  • Новые главы книги Zenwalk. Приобщение к Linux:
  • Глава 8. Пакеты: средства установки, системы управления, системы построения
  • Глава 9. Zenwalk: репозитории, пакеты, методы установки

    23 июля

    CITKIT.ru:

  • Все против всех. 64 vs 32, Intel vs AMD, tmpfs vs ext3
  • Две головы от Intel

  • Zenwalk: обзор штатных приложений (глава из книги "Zenwalk. Приобщение к Linux")

  • Нормально, Григорий...

    16 июля

    Обзоры журнала Computer:

  • Перспективы и проблемы программной инженерии в XXI веке
  • Большие хлопоты с большими объемами данных
  • Перспективы наноэлектроники

    CITKIT.ru:

  • Интермедия о лицензиях (А.Федорчук. "Zenwalk. Приобщение к Linux")

  • Есть ли будущее у KDE?

  • Linux в школе: альтернативный вариант в задачах

  • Шифр (приключения агента Никодима)

    10 июля

    CITKIT.ru:

  • Новые разделы книги А. Федорчука Zenwalk. Приобщение к Linux:
  • Интермедия вступительная. Linux или GNU/Linux? Как вас теперь называть?
  • Глава 5. Среда Xfce
  • Глава 6. Xfce: приложения и плагины

  • ZUR (Zenwalk User Repository) FAQ

    2 июля

  • Персистентность данных в объектно-ориентированных приложениях (С. Кузнецов)

    CITKIT.ru:

  • Новые разделы книги А. Федорчука Zenwalk. Приобщение к Linux:
  • Интермедия 1.2. Дорога к Zenwalk'у. Период бури и натиска
  • Интермедия 3.3. Немного о Linux'е и "железе"
  • Глава 4. Настройка: инструментами и руками
  • Интермедия 4.1. Zenpanel и конфиги: поиски корреляции

  • Интервью с Жан-Филиппом Гийоменом, создателем дистрибутива Zenwalk

  • Linux в школе: первые итоги (С. Голубев)

    25 июня

    CITKIT.ru:

  • Zenwalk. Приобщение к Linux (А. Федорчук)

  • Логика и риторика (С.Голубев)

  • Технология Tru64 AdvFS

  • Ханс Райзер предлагает отвести полицейских к телу Нины

    18 июня

  • Проекты по управлению данными в Google (Пересказ: С. Кузнецов)

    CITKIT.ru:

  • ОС и поддержка "железа": мифы и реальность (А. Федорчук)

  • Linux в школе: другие дистрибутивы

  • Пинок (С. Голубев)

    4 июня

  • Ландшафт области управления данными: аналитический обзор (С. Кузнецов)

    CITKIT.ru:

  • Linux в школе: слово заинтересованным лицам

  • SlackBuild: пакеты своими руками

  • Linux от компании Novell. Установка и обзор openSUSE Linux

    Все публикации >>>




  • IT-консалтинг Software Engineering Программирование СУБД Безопасность Internet Сети Операционные системы Hardware

    Информация для рекламодателей PR-акции, размещение рекламы — тел. +7 495 4119920, ICQ 232284597 Пресс-релизы — pr@citcity.ru
    Послать комментарий
    Информация для авторов
    Rambler's Top100 TopList liveinternet.ru: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня This Web server launched on February 24, 1997
    Copyright © 1997-2000 CIT, © 2001-2007 CIT Forum
    Внимание! Любой из материалов, опубликованных на этом сервере, не может быть воспроизведен в какой бы то ни было форме и какими бы то ни было средствами без письменного разрешения владельцев авторских прав. Подробнее...