Программерские заметки: февраля 2008

вторник, 19 февраля 2008 г.

Оптимизация кода

Сегодня удалось добиться примерно десятикратного ускорения работы моего парсера. Проблема вообще возникла из-за того, что я относился к обработке строк в С/С++ стиле - преобразовывал строку с массив символов и переберал их для нахождения начала и окончания блоков. Делать это на Ruby - далеко не лучшая идея. На языке высокого уровня нет смысла использовать низкоуровневый подход. Если в С при переборе символов строки достаточно инкрементировать значение указателя, то здесь будет создан(а затем и уничтожен) объект для каждого символа. В общем совершенно ничего хорошего. Поэтому использовавние функции String#index с простейшим регекспом даёт значительный эффект. Что конечно же не может не радовать.
Для обзначения начала и окончания блоков используются символы '{' и '}'. Для поиска конца блока использовалась следующая функция


def find_end(str)
 arr = str.split(//)
 open_count = 0
 close_count = 0
 pos = 0
 arr.each do |x|
  open_count += 1 if(x == "{")
  close_count += 1 if(x == "}")
  if(open_count == close_count)
   return pos
  end
  pos += 1
 end
 nil
end

Теперь эта функция выглядит так:


def find_end(str)
 open_count = 0
 close_count = 0
 pos = 0
 while(pos != nil)
  pos = str.index(/\{|\}/, pos)
  if(pos != nil)
   open_count += 1 if str[pos] == 123
   close_count += 1 if str[pos] == 125
  end
  if(open_count == close_count)
   return pos
  end
  pos += 1
 end
 nil
end

Вероятно этот код можно ещё ускорить, но я пока не знаю как. Кроме ускорения за счёт оптимального использования возможностей языка, значительного эффекта можно добиться за счёт применения более эффективного алгоритма. Здесь у меня тоже есть над чем поработать. =)

пятница, 15 февраля 2008 г.

Проблемы с производительностью

В проекте, над которым я сейчас работаю, достаточно активно используются файлы в xml-подобном формате. И я решил написать для него парсер на Ruby. Сделать это оказалось достаточно просто, но вылезла другая проблема - проблема производительности. Файл в 650 строк на моём стариньком ноутбуке (500 МГц P3) парсится примерно 20 секунд. В Ruby есть очень полезаная библиотека profiler, позволяющая посмотреть сколько именно времени занимает каждая из частей программы. Причём для того, чтобы её применить не нужно ничего менять в своём коде, а достаточно только подключить профайлер. Так вот использование профайлера показало мне, что больше всего работы происходит внутри Array#each. Сейчас думаю, каким образом можно всё ускорить. Возможность сделать всё быстро доказывается наличием парсера rexml, полностью написаного на Ruby.

пятница, 8 февраля 2008 г.

Ещё одна книжка.

Предыдущую книгу я осилил почти неделю назад. Теперь взялся за следующую - Everyday Scripting with Ruby: for Teams, Testers, and You by Brian Marick. Эта книга также из той же серии, что и Programming Ruby. Здесь рассмотрено несколько практических примеров использования Ruby для всяческой автоматизации работы. Например инвентаризация файла или подсчёт количества изменений в SVN.

Программерские заметки

вторник, 19 февраля 2008 г.

Оптимизация кода

пятница, 15 февраля 2008 г.

Проблемы с производительностью

пятница, 8 февраля 2008 г.

Ещё одна книжка.

Обо мне

Ярлыки

Архив блога

Программерские заметки

вторник, 19 февраля 2008 г.

Оптимизация кода

пятница, 15 февраля 2008 г.

Проблемы с производительностью

пятница, 8 февраля 2008 г.

Ещё одна книжка.

Обо мне

Ярлыки

Архив блога

вторник, 19 февраля 2008 г.

пятница, 15 февраля 2008 г.

пятница, 8 февраля 2008 г.