» Форма входа

»Мoy-weB ver.4.1

» Статистика

Главная » 2008 » Сентябрь » 20 » Ускоряем JavaScript (2 часть)

Ускоряем JavaScript (2 часть)
20.Сен.2008 | 21:21:14

Твой лучший друг кэш


Дело в том, что мы
подходим к проблеме не с той стороны. Все возможные стратегии
кэширования отталкиваются от того, что клиент спрашивает сервер,
насколько актуальна копия, хранимая в кэше. Если бы сервер сам, без
запроса, сообщал клиенту об изменениях файлов, то клиент в любой момент
времени знал бы, что кэшированная копия валидна. Но веб устроен иначе -
клиент запрашивает сервер, и никак иначе.

Или все же слегка
иначе? Ведь перед отправкой любых javascript- или css-файлов клиент
запрашивает страницу, которая на них ссылается с помощью тегов
<script> и . И мы можем использовать реакцию сервера для
информирования клиентов о любых изменениях, произошедших с этими
ресурсами. Звучит немного загадочно, поэтому скажу прямо: если мы будем
изменять названия javascript- и css-файлов при каждом изменении их
содержания, то сможем разрешить клиенту хранить их в кэше вечно (ведь
содержимое файла по отдельно взятому адресу не меняется).

Если
мы уверены в том, что конкретный ресурс никогда не изменится, то можем
отправить несколько по-настоящему агрессивных заголовков. В php нам
потребуется всего пара строк:


header("expires: ".gmdate("d, d m y h:i:s", time()+315360000)." gmt");
header("cache-control: max-age=315360000");
?>


Так мы говорим браузеру, что содержимое
файла останется неизменным в течение десяти лет (т.е. плюс-минус 315
360 000 секунд), поэтому, единожды загрузив файл, браузер может
следующие десять лет использовать локальную копию. Конечно,
необязательно использовать для отправки javascript и css именно php. Мы
перейдем к этому через несколько минут.

Ошибка на ошибке


Ручное
изменение названий файлов при изменении их содержимого - опасное
занятие. Что произойдет, если вы переименуете файл, но забудете
переименовать шаблоны, указывающие на него? Что произойдет, если вы
поменяете не все шаблоны, а только часть? Что случится, если вы
измените шаблоны, но сам файл не переименуете? И наиболее вероятный
вариант: что произойдет, если вы измените содержимое, но забудете
переименовать файл или изменить ссылки на него? В лучшем случае,
пользователи будут работать на старой версии сайта. В худшем - сайт
перестанет работать совсем. В общем, ручное изменение названий -
дурацкая идея.

На наше счастье, компьютеры с такими задачами -
тупым повторением одних и тех же операций при совпадении определенных
условий - справляются отменно.

Чтобы сделать этот процесс
максимально безболезненным, следует для начала уяснить, что нам вообще
не нужно переименовывать файлы. Между реальным расположением файла на
диске и url, с которого он доставляется пользователю, нет ничего
общего. Так что в случае apache мы можем использовать mod_rewrite,
создав простое правило для редиректа определенных url к нужным файлам:


rewriteengine on
rewriterule
^/(.*.)v[0-9.]+.(css|js|gif|png|jpg)$ /$1$2 [l]


Это правило обрабатывает все url с
указанными расширениями, которые также содержат суффикс версии. В
процессе обработки правило переписывает url так, чтобы он указывал на
путь к нужному файлу (исключая при этом суффикс). Например:


url Путь

/images/foo.v2.gif /images/foo.gif
/css/main.v1.27.css css/main.css
/javascript/md5.v6.js /javascript/md5.js


Когда это правило работает, мы можем
менять url (добавляя к нему суффикс версии), не меняя расположения
файла на диске. Обнаружив, что url изменился, браузер считает, что ему
нужно обратиться к новому ресурсу.

Вы можете поинтересоваться,
почему мы просто-напросто не использовали динамические ссылки
(например, /css/main.css?v=4)? Дело в том, что, согласно спецификации
http, пользовательские агенты вообще не должны кэшировать такие url. И
хотя ie и firefox это игнорируют, opera и safari точно следуют букве -
поэтому, чтобы гарантировать корректную работу всех браузеров при
кэшировании наших ресурсов, мы избегаем использовать динамические
ссылки.

Теперь, когда мы научились менять url без перемещения
файла, было бы неплохо автоматизировать обновление url. В небольшой
рабочей среде (или в среде разработки, для тех, кому приходится иметь
дело с большими рабочими средами) это довольно легко осуществить с
помощью функций шаблона. Следующий пример сделан на основе smarty, но
может быть реализован и на основе других подобных движков:

smarty:


php:
function
smarty_version($args){

$stat = stat($globals[‘config’][‘site_root’].$args[‘src’]);
$version = $stat[‘mtime’];

echo
preg_replace(!.([a-z]+?)$!, ".v$version.$1", $args[‘src’]);
}
output:


Для каждого залинкованного ресурса мы
определяем местоположение файла на диске, проверяем его mtime (дату
последнего изменения) и вставляем эту информацию в url в виде номера
версии. Это прекрасно работает на сайтах с низким трафиком (где метод
stat, возвращающий информацию о файлах и каталогах, обходится довольно
дешево) и в среде разработчика, однако плохо масштабируется на большие
сайты, поскольку каждый вызов stat означает обращение к диску на чтение.

Решить
эту проблему нетрудно. В больших системах у нас изначально есть номер
версии для каждого ресурса в виде номера, присвоенного системой
контроля версий (вы же используете систему контроля версий, правда?).
На этапе финального построения нашего сайта требуется лишь проверить
номера версий всех нужных файлов и записать их в статический
конфигурационный файл.


$globals[‘config’][‘resource_versions’] = array(

/images/foo.gif’ => ‘2.1’,
/css/main.css’ => ‘1.27’,
/javascript/md5.js’ => ‘6.1.4’,
);
?>


Затем мы меняем нашу функцию в шаблоне, чтобы она могла использовать эти номера версий при реальной работе.


function smarty_version($args){

if (
$globals[‘config’][‘is_dev_site’]){

$stat = stat($globals[‘config’][‘site_root’].$args[‘src’]);
$version = $stat[‘mtime’];
}else{
$version = $globals[‘config’][‘resource_versions’][$args[‘src’]];
}

echo
preg_replace(!.([a-z]+?)$!, ".v$version.$1", $args[‘src’]);
}
?>


Таким образом, нам не нужно
переименовывать файлы или даже запоминать, когда мы изменяли их
содержимое, - url автоматически будут изменяться каждый раз, когда мы
перерабатываем сайт. В общем, почти приехали.

Собираем все вместе


В
разговоре об отправке заголовков, обеспечивающих долговременное
хранение статических ресурсов в кэше, мы отметили, что если отдача
контента реализована не на php, то простого способа добавления таких
заголовков не существует. Чтобы справиться с этой проблемой, мы можем
либо все же использовать php, либо переложить задачу модификации
заголовков на apache.

Использовать для нашей цели php нетрудно.
Мы просто должны изменить правила rewrite для статических файлов, чтобы
они проходили через php-скрипт, и написать сам скрипт, который будет
выдавать нужные заголовки, перед тем как передать эти файлы по запросу.


apache:

rewriterule ^/(.*.)v[0-9.]+.(css|js|gif|png|jpg)$ /redir.php?path=$1$2 [l]

php:

header("expires: ".gmdate("d, d m y h:i:s", time()+315360000)." gmt");
header("cache-control: max-age=315360000");

# ignore paths with a ‘..’
if (preg_match(!..!, $_get[path])){ go_404(); }

# make sure our path starts with a known directory
if (!preg_match(!^(javascript|css|images)!, $_get[path])){ go_404(); }

# does the file exist?
if (!file_exists($_get[path])){ go_404(); }

# output a mediatype header
$ext = array_pop(explode(., $_get[path]));
switch (
$ext){
case
‘css’:
header("content-type: text/css");
break;
case
‘js’ :
header("content-type: text/javascript");
break;
case
‘gif’:
header("content-type: image/gif");
break;
case
‘jpg’:
header("content-type: image/jpeg");
break;
case
‘png’:
header("content-type: image/png");
break;
default:
header("content-type: text/plain");
}

# echo the file’s contents
echo implode(‘’, file($_get[path]));

function
go_404(){
header("http/1.0 404 file not found");
exit;
}



Несмотря на то что такой подход
работает, это не лучшее решение. php в сравнении с apache требует
больше памяти и времени на исполнение. Кроме того, нам необходимо
соблюдать осторожность из-за возможных эксплойтов. Дабы избежать всей
этой головной боли, мы можем попытаться использовать apache напрямую.
Директива rewriterule позволяет нам устанавливать значения переменных
окружения при срабатывании директивы, тогда как директива header
добавляет заголовки лишь в том случае, когда присвоенно значение
заданной переменной. Комбинируя две эти директивы, мы легко можем
составить нужную цепочку инструкций:


rewriteengine on
rewriterule
^/(.*.)v[0-9.]+.(css|js|gif|png|jpg)$ /$1$2 [l,e=versioned_file:1]

header add "expires" "mon, 28 jul 2014 23:30:00 gmt" env=versioned_file
header add
"cache-control" "max-age=315360000" env=versioned_file


Из-за порядка исполнения apache, мы
должны добавить строчку re-writerule в главный конфигурационный файл
(httpd.conf), а не в .htaccess, иначе строчки header будут исполнены
первыми, перед установкой переменной окружения. Сами строчки header
могут быть размещены и в главном конфигурационном файле, и в .htaccess
- их местоположение ни на что не влияет.
Категория: Статьй и уроки | Просмотров: 576 | Добавил: CorsaR
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]