Функция url_for и переменные url-адреса

Типы ссылок

В SEO принято выделять несколько типов ссылок.

Естественные – основной приоритет для поисковых систем. Такие ссылки обычно ставят в качестве рекомендаций в статьях или заметках, обзорах, чтобы рассказать пользователям об интересном продукте, проекте, сервисе.

Арендованные – размещаются за деньги на определенный период времени, например на месяц. Пока вы платите, ссылка на ваш сайт находится на доноре.

Вечные – самый дорогой тип ссылок. Размещаются в статьях, обзорах, пресс-релизах с тематическим текстом. Они не удаляются, но стоят дорого, если донор действительно качественный и авторитетный.

Статейные – в основном используются для продвижения по высокочастотным запросам. Под них пишут уникальные и качественные SEO-тексты.

Баннерные – представляют собой ссылки, где вместо текста присутствует баннер. Это может быть как обычная картинка, так и красочная анимация. В основном размещаются на сайтах с высокой посещаемостью.

Классификация анкоров

 Анкор ссылки может представлять собой:

  • точное вхождение, т. е. быть прописан в том же виде, что и ключевое слово, например «купить машину»;
  • запрос с разбавлением, т. е. содержать несколько дополнительных слов, которые будут полезны для продвижения сайта. Например, «купить в Москве машину»;
  • текст запроса с окружением, т. е. с околоссылочным текстом. Например, «как заказать доставку цветов в Краснодаре». В этом случае «доставка цветов» – ключевая фраза, а все остальное – околоссылочный текст.

Есть и другие классификации анкоров у ссылок, например по типу вхождения, но все эти термины знакомы лишь узкому кругу людей, занимающихся продвижением сайтов.

Кодирование URL

Пример кодирования можно видеть в русскоязычной Википедии, использующей в URL русский язык. Например, строка вида:

https://ru.wikipedia.org/wiki/Википедия

кодируется как:

https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F

Реализация

Преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в UTF-8 в последовательность из двух байтов, а затем каждый байт этой последовательности записывается в шестнадцатеричном представлении с предшествующим знаком процента (%):

В → D0 и 92 → %D0%92
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
и → D0 и B8 → %D0%B8, и т. д.
Зарезервированные символы
Не зарезервированные символы

Все другие символы в URI кодируются.

Зарезервированные символы кодируются в таком соответствии:

! » # $ % & * + , ; < = > ? ^ ` { | } <пробел>
%21 %22 %23 %24 %25 %26 %27 %2A %2B %2C %3A %3B %3C %3D %3E %3F %5B %5D %5E %60 %7B %7C %7D %20

Кодирование параметров в Internet Explorer и старом Firefox происходит несколько иначе.

В некоторых случаях URL формируется с использованием кодирования Base58.

Стандарт IRI

Основная статья: Internationalized Resource Identifier

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами подавляющего большинства языков может стать нечитаемым для человека.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. Internationalized Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы IRI заменить столь широко используемые URL (и URI в целом).

Копирование русских url’ов

Раньше все адреса в интернете были только латинскими, то есть состояли исключительно из английских букв. Но сейчас ситуация изменилась и частенько можно встретить русский адрес или его часть. Например:


И вот с русскими частенько возникают проблемы при копировании. Точнее, копирование происходит как обычно, а вот при вставке получается абракадабра. Например, должно быть вот так: https://ru.wikipedia.org/wiki/Электронная_почта. А получилось вот что: https://ru.wikipedia.org/wiki/%D0%AD%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%BF%D0%BE%D1%87%D1%82%D0%B0

Это связано с особенностями разных браузеров – Opera, например, такие адреса нормально копирует, а вот Google Chrome — нет.

Такая некрасивая ссылка всё равно будет открываться, но если хочется отправить ее в нормальном виде, тогда придется копировать по частям. То есть сначала выделяем адрес до русских букв и копируем/вставляем его.

А потом отдельно выделяем и копируем русскую часть.

Ну, и вставляем ее после английской. А только потом это все это отправляем (публикуем). Главное, чтобы между обеими частями не было пробелов, иначе адрес может не открыться.

Существующие URL-протоколы

В настоящее время существует огромное количество различных протоколов для работы в разных сетях и сервисах, программах, и все они поделены на условные три категории. К первой относятся стандартные протоколы ftp, https (с шифрованием для повышения уровня безопасности), mailto (почтовая служба), xmpp. Вторая группа – это экзотические схемы, такие как skype (программа связи), ednk (файловый обмен), bitcoin (криптовалюта), steam (онлайн-покупки цифровых продуктов), Tg (Telegramm-мессенджер). Также существуют браузерные протоколы с соответствующими именами, например opera, chrome или browser. В каждой категории десятки различных протоколов, и с каждым днем их число растет.

Схема URL

У URL есть своя модель

Общая модель, или иначе, структура URL-адреса выглядит так:

схема://логин:пароль@хост:порт/URL‐путь?параметры#якорь

Что в себе несет каждая характеристика, указанная выше:

Схема – это некий акт передачи данных, по которому браузер обращается к его источнику.

Логин и пароль — это далеко нечасто использующиеся параметры, в которых указываются имя и особый код-шифр, который придумает пользователь, необходимых для связи с интернет ресурсом.

К примеру, чтобы получить доступ к странице по акту http, эти данные можно не указывать.

@ — обозначается, если существует пара логин-пароль. Если такого нет, то обозначать не следует.


Порт – особый номер, который присваивается определенной программе, обрабатывающей запрос браузера.

URL — путь – в нем обозначается информация с некими уточнениями о геолокации файлов. Она зависит от того акта, который используется. В случае с протоколом HTTP задается путь с указанием разделов и подразделов, в котором находятся файлы.

Параметры — строка запроса, в которой находятся запросы, что передаются на сервер методом GET параметрами.

Знак & — является неким разделителем параметров.

Якорь – неповторимая нигде больше строка, а именно набор цифр и/или букв, что опирается на особый исключительны й раздел или область определенного документа, который в дальнейшем будет открыт.

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы PURL (англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

URL адрес — что это такое?

«URL адрес» – представляет собой местонахождение определенного интернет ресурса. Под ним подразумевается документ, изображение или сайт, которые находятся в интернете на сервере. В то время как «сервер» – дистанционное хранилище, к котором находится различная информация. Он имеет подобие шкафа, в котором можно разместить для хранения личные вещи, а затем в любой момент взять их для использования. По такому же принципу сведения размещаются на сервере и при необходимости могут быть получены из него.

С помощью URL адреса в глобальной сети можно разыскать определенный ресурс. Например, для отображения URL конкретной страницы в интернете потребуется разыскать ее первичный файл, а именно код. Благодаря URL адресу пользователи смогут достаточно быстро узнать, в каком «шкафу» хранятся их «вещи» в виде сайта.

То же самое касается URL любого документа или изображения. Данные файлы сберегаются в определенном месте, а конкретнее на сервере. С помощью URL можно легко узнать адрес требуемого сервера. Каждый из них отличается собственной и совершенно неповторимой структурой.

На рисунке можно проследить иерархию от конечного сервера к обычным компьютерам пользователей. Сверху находится сервер с требуемым ресурсом, а в нижней части — компьютеры. В промежутке между ними расположены дополнительные серверы.

Тор и адресация в ДаркНет

Существует отдельный сегмент сети, так называемый DarkNet, в который невозможно попасть посредством стандартных браузеров. Все, что можно найти через Яндекс Браузера, Google Chrome и Opera, считается относительно безопасным (за исключением упомянутых фишинговых сайтов и хакерских атак).

В «темную» часть интернета можно попасть с помощью браузера Tor, который работает по принципу запутывания следов и скрытия IP-адреса пользователя. Через этот браузер можно попасть на обычные сайты, но это займет неоправданно много времени.

Tor – браузер для выхода в DarkNet.

Адреса в Tor отличаются от стандартных доменной зоной. Если в привычном нам интернете это .ru, .рф, .com, то в ДаркНете используется псевдо-доменная зона — .onion. Как правило, вы должны заранее знать адрес сайта в зоне .onion.

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов FTP
  • http — Протокол передачи гипертекста HTTP
  • rtmp — Real Time Messaging Protocol проприетарный протокол потоковой передачи данных, в основном используется для передачи потокового видео и аудиопотоков с веб-камер через интернет.
  • rtsp — Потоковый протокол реального времени.
  • https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet
  • nntp — Новости Usenet через протокол NNTP
  • irc — Протокол IRC
  • smb — Протокол SMB/CIFS
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию Telnet
  • wais — База данных системы WAIS
  • xmpp — Протокол XMPP (часть Jabber)
  • file — Имя локального файла
  • data — Непосредственные данные (Data: URL)
  • tel — звонок по указанному телефону

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей MIME
  • mid — Идентификатор сообщений для электронной почты
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии Telnet 3270
  • z39.50 — Доступ к службам ANSI Z39.50
  • skype — Протокол Skype
  • smsto — Открытие редактора SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P
  • market — Android Маркет
  • steam — протокол Steam
  • bitcoin — Криптовалюта Биткойн
  • ob — OpenBazaar
  • tg — Telegram

Схемы URL в браузерах:

  • view-source — просмотр исходного кода указанной web-страницы в различных браузерах.
  • chrome — служебные страницы браузера Google Chrome или браузеров на движке Gecko. В Яндекс. Браузере перенаправляет на browser://
  • opera — служебные страницы браузера Opera.
  • browser — служебные страницы Яндекс.Браузера.

Как узнать URL сайта (документов, изображения или файлов)

Далеко не все пользователи интернета имеют представление, где узнать URL адрес. Если мы говорим о сайте, то эта информация доступна в адресной строке. В качестве примера на рисунке можно увидеть адрес статьи в браузере.

Необходимо знать, что в браузере, как правило, параметр <способ> из рассмотренной структуры отсутствует.

На представленном рисунке перед адресом отсутствует «http». Чаще всего этот параметр становится доступным после того, как адрес будет скопирован в буфер. Эта процедура выполняется обычным методом – в результате нажатия на соответствующие кнопки Ctrl+C. Еще один вариант для выделения текста — нажать с помощью правой клавиши мышки и в появившемся меню найти специальный пункт под названием «Копировать».

Меню, которое появляется после выделения адреса сайта

Как уже упоминалось ранее, URL адрес имеется как на сайтах, так и у некоторых документов, картинок и файлов.

В целях получения информации о их URL можно кликнуть на определенную картинку или файл с помощью правой клавиши мышки и в появившемся меню найти пункт «Копировать адрес изображения».

Меню, которое появляется после нажатия на изображение с помощью правой клавиши мышки

Если требуется скопировать адрес документа, то на него также необходимо кликнуть с помощью правой клавиши мышки, а затем появится меню, в котором следует найти пункт «Копировать адрес ссылки».

Меню, которое открывается в результате нажатия на документ посредством правой клавиши мышки

В рассмотренных рисунках представлено меню в браузере Chrome. Его внешний вид может отличаться, так как зависит от других применяемых браузеров. Но. в любом из них все существующие пункты имеют одинаковое название.


В результате копирования ссылки и дальнейшего ее размещения в буфере обмена она может быть легко вставлена в требуемый текстовый документ или адресную строку. С помощью этого метода можно достаточно просто уточнить адрес любого интернет ресурса.

Например, в конце скопированного изображения будет присутствовать расширение файла – jpg. После параметра <хост> — после «/» можно увидеть адрес, с помощью которого будет предоставлено местонахождение картинки.

В основном в подобных адресах бывает все понятно. У многих пользователей может вызывать вопросы, например, такая конструкция как: «%E1%85%9611». Она обозначает зашифрованную часть адреса.

Как узнать URL страницы: ВКонтакте, Одноклассников, видео, радио

Чтобы узнать и скопировать URL адрес популярных социальных сетей вконтакте, одноклассники, а также видео (страницы) ролика, радиостанции и т.д. необходимо вверху стрницы нажать правой кнопкой мыши:

URL страницы ВКонтакте.

URL страницы Одноклассники.

URL страницы Ютуб, адрес видео.

URL Радиостанции (онлайн).

Шифрование в URL

Уточнить конкретный адрес ресурса или сайта можно достаточно просто. В некоторых ситуациях после копирования стандартного адреса появляется целый набор символов, например: «https://pc4me.ru/%D0%A2%D0%B0%D0%B0%D2%80%D3%82%D1%84%D0%BE%D1%BD». На самом деле они представляют собой определенную шифровку.

Если не вдаваться в подробности, то все URL адреса обозначаются посредством некоторого набора цифр, знаков и букв. Подобное шифрование осуществляется для того, чтобы устройству было понятно, куда необходимо обращаться.

Этапы кодирования:

  1. в Юникод – получается последовательность из нескольких байтов;
  2. в шестнадцатеричный код.

В последних версиях браузеров предварительно выполняется соответствующее кодирование в Base58. Любой байт разделяется с помощью специального значка «%». В итоге после копирования пользователи могут видеть целый набор различных символов. В новых браузерах уже не возможно наблюдать ссылки с шестнадцатеричными знаками.

Если при копировании нормальной ссылки появляется, например, «https://pc4me.ru/wiki/%D0%A2%D0%BЕ%D0%B1%D1%80%D2%82%D1%82%D0%BE%D1%BD», то необходимо выполнить обновление используемого браузера на более новую версию.

«Человекопонятный URL» и особенности его генерирования

«Человекопонятный» URL – это тот же адрес ресурса, но приведенный в удобочитаемую форму, например «site.ru/content/seo». Может содержать дополнительные модули или плагины, скрытые из вида, за счет чего часто используется в CMS. С помощью таких адресов гораздо легче работать со структурой сайта, вносить в нее изменения

Важно, что в человекопонятной форме пользователь сможет запомнить URL сайта или страницы, чтобы впоследствии вернуться к ее просмотру с другого устройства

Благодаря перечисленным выше инструментам у разработчиков и пользователей не возникает проблем в работе с адресами сайтов в сети Интернет, их копированием, редактированием и формированием ссылок.

Кириллические URL-адреса

Не так давно для российский сайтов была создана доменная зона первого уровня на кириллице -.рф, которая теперь функционирует на одном уровне с .ru. Действует такой формат УРЛа примерно с 2009 года.

Зачастую УРЛы русскоязычных сайтов при копировании из адресной строки меняют свое содержание. Если адрес был написан на русском, то после копирования он может быть заменен непонятным перечнем символов (Punycode или пуникод). Такое шифрование URL необходимо в случае, если он написан не латиницей.


Примеры кириллических URL: займы.рф, волшебная-улыбка.рф, гибдд.рф и т.д.

Такие УРЛы легко читаются и запоминаются, русскоязычному пользователю на много проще ввести в адресную строку именно кириллический URL, и это его главное преимущество.

Ввиду того, что многие латинские слова в зоне .ru заняты, в зоне РФ, как более молодой, часто можно найти свободное интересное доменное имя. Оно будет отражать суть вашего бизнеса, включать ключевые слова (SEO-продвижение), будет коротким (его легче запомнить пользователю и набрать в адресной строке), да и на визитках такой адрес выглядит презентабельно.

Помимо читабельности интернет-адреса важна его длина. Считается, что короткий URL имеет некоторые преимущества:

  • его проще запомнить пользователю. В таком случае возрастает вероятность, что человек сможет зайти на сайт посредством прямого набора адреса;
  • кликабельность коротких адресов выше;
  • короткий URL при размещении в тексте выглядит презентабельнее.

Имя и расширение файла

Определенные файлы для извлечения идентифицируются по имени файла и расширению. Вы можете задать своему файлу любое нужное имя, а расширение файла будет указывать на тип файла. HTML документы (или XHTML) будут иметь расширение или (сокращенный вариант используется на некоторых серверах, которые поддерживают только три буквы в расширении). CSS-файлы используют расширение , файлы с JavaScript кодом используют и так далее. Веб-серверы настраивают на узнавания этих расширений и обработки файлов соответствующим образом, обработка различных типов файлов осуществляется различными способами.

Скорее всего вы не увидите имя файла и его расширение в каждом URL-адресе с которым вы столкнётесь. Большинство веб-серверов настраивают для автоматического обнаружения специально именованного файла при запросе каталога без указанного имени файла. Это может быть файл , или какое-нибудь другое имя, в зависимости от настроек сервера. Действительно, большинство различных частей URL-адреса могут быть зависимы от конфигурации конкретного сервера.

URL-адрес является инструментом, который позволяет создавать ссылки на другие файлы в интернете, включая другие файлы вашего собственного сайта. Вам часто придется использовать URL-адреса в HTML и CSS.

С этой темой смотрят:

  • Создание html документа
  • Абсолютные и относительные ссылки html

Возможное дальнейшее развитие интернет адресов

Основные проблемы современных URL:

  • определенные проблемы с шифрованием;
  • незначительная гибкость;
  • указание пути на нереальные ресурсы;
  • неудовлетворительная работа с гипертекстовой структурой;
  • навязывание интернет ресурсам иерархической структуры (отметил создатель URL).

Из-за наличия указанных причин была предложена другая интерпретация URL, которая имеет название PURL. Согласно новому стандарту, сейчас будет применяться несколько иной подход. В основе будет находиться информационная база PURL, где должны будут размещаться пути и имена требуемых ресурсов.

Система будет заниматься постоянной проверкой данных ресурсов и затем обновлять или удалять ссылки на них. В результате этого можно будет решить большую часть описанных выше проблем. Для устранения оставшихся недостатков специалисты все еще занимаются тщательным поиском.

В ролике доступна полезная информация про интернет. В результате его просмотра можно будет более детально узнать, что представляет собой URL, а также какая роль принадлежит ей в глобальной сети.

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII‐символов (к примеру, пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

В этой записи:

схема 
схема обращения к ресурсу; в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль указанного пользователя
хост 
полностью прописанное доменное имя хоста в системе DNS или IP-адрес хоста в форме четырёх групп десятичных чисел, разделённых точками; числа — целые в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса; зависит от протокола.
параметры 
строка запроса с передаваемыми на сервер () параметрами. Начинается с символа , разделитель параметров — знак . Пример:
якорь 
идентификатор «якоря» (англ.)русск. с предшествующим символом . Якорем может быть указан заголовок внутри документа или атрибут id (англ.)русск. элемента. По такой ссылке браузер откроет страницу и переместит окно к указанному элементу. Например, ссылка на этот раздел статьи: .

Виды ЧПУ

Сегодня существуют три основных вида ЧПУ:

  1. Транслит (латинские буквы с русского языка)

    Адрес, прописанный транслитом, будет понятен как посетителям сайта, так и поисковым системам. Поисковики в рунете предпочитают именно такой вариант. Поэтому мы рекомендуем использовать именно транслитерированную кириллицу.

    Если ваша страница называется на русском языке «Холодильные камеры», то при транслите чпу будет выглядеть как «/holodilnie-kameri/» или «/xolodilnie-kamery/» — в зависимости от того, как в системе настроен транслит.

  2. Латиница (русские слова на английском языке)

    Тоже хороший вариант для написания адресов, так как многим интернет-пользователям понятны часто используемые английские слова. Употребление латиницы особенно актуально для сайтов, продвигаемых за границей (в англоговорящих странах).

    Если ваша страница называется на русском языке «Современные кухни», то при латинице чпу будет выглядеть «/modern-kitchen/».

  3. Кириллица (адрес страницы русскими словами)

    Сегодня многие сайты, например, Википедия, используют кириллические урлы. Насколько это удобно – вопрос спорный. С одной стороны, адрес становится максимально информативным и понятным для русского человека. С другой – при копировании и вставке такой URL автоматически перекодируется в Punycode, превращаясь в непонятный набор символов.

    Если ваша страница называется на русском языке «Банкетные залы», то при кириллице чпу так и будет выглядеть «/Банкетные-залы/».


С этим читают