Difference between revisions of "SynEdit Highlighter/ru"

From Lazarus wiki
Jump to navigationJump to search
Line 92: Line 92:
== The Basics: Returning Tokens and Attributes ==
== Основы: возвращение токенов и атрибутов ==
As indicated, the '''SimpleHl''' unit demonstrates this process.
Как указано, модуль '''SimpleHl''' демонстрирует этот процесс.
=== What it does===
=== Что он делает ===
* It splits each line into words and spaces (or tabs)
* Он разбивает каждую строку на слова и пробелы (или табуляции)
** The spaces are part of the text, and must be highlighted too
** Пробелы являются частью текста и также должны быть подсвечены
* This example allows specifying different colors for
* Этот пример позволяет указать разные цвета для
::- text (defaults to not-highlighted)
::- текста (по умолчанию не подсвечен)
::- spaces (defaults to silver frame)
::- пробелов (по умолчанию в серебристой рамке)
::- words, separated by spaces, that start with a,e,i,o,u (defaults to bold)
::- слов, разделенных пробелами, начинающихся с a,e,i,o,u (по умолчанию выделены жирным шрифтом)
::- the word "not" (defaults to red background)
::- "не" слов (по умолчанию на красном фоне)
=== How it works ===
=== Как это работает ===
* Creation  
* Creation
The Highlighter creates Attributes that it can return the Words and Spaces.
Highlighter создает Атрибуты, которые могут вернуть Words(слова) и Spaces(пробелы).
* SetLine
* SetLine
Is called by SynEdit before a line gets painted (or before highlight info is needed)
Событие вызывается SynEdit до того, как будет прорисована строка (или до того, как потребуется информация о выделении)
* GetTokenEx, GetTokenAttribute, Next, GetEol
* GetTokenEx, GetTokenAttribute, Next, GetEol
Are used by SynEdit to iterate over the Line.
События используются SynEdit для перебора строки.
Note that the first Token (Word or Spaces) must be ready after SetLine, without a call to Next.
Обратите внимание, что первый токен (слово или пробел) должен быть готов после SetLine, без вызова Next.
[[Important:]] The tokens returned for each line must represent the original line-text, and be returned in the correct order.
{{Note| токены, возвращаемые для каждой строки, должны представлять исходный текст строки и возвращаться в правильном порядке.}}
* GetToken, GetTokenPos, GetTokenKind
* GetToken, GetTokenPos, GetTokenKind
SynEdit uses them e.g for finding matching brackets.
SynEdit использует их, например, для поиска подходящих скобок.
If tokenKind returns different values per Attribute, then brackets only match, if they are of the same kind (e.g. if there was a string attribute, brackets outside a string would not match brackets inside a string).
Если tokenKind возвращает разные значения для каждого атрибута, то скобки совпадают только в том случае, если они имеют одинаковый вид (например, если был строковый атрибут, скобки вне строки не будут совпадать с скобками внутри строки).
=== Other notes===
=== Другие заметки===
For readability, the highlighter has no optimization, so it may be very slow on larger texts.
Для удобства чтения highlighter не имеет оптимизации, поэтому он может быть очень медленным для больших текстов.
Many of the supplied highlighters use hash functions, to find what word (or any group of chars) is.
Многие из поставляемых highlighter'ов используют хеш-функции, чтобы найти слово (или любую группу символов).
== Step 2: Using Ranges ==
== Step 2: Using Ranges ==

Revision as of 09:52, 10 September 2019


Для получения дополнительной информации о SynEdit перейдите к: SynEdit

Прим.перев.: дабы далее на загромождать текст, под термином Highlighter будет подразумеваться механизм(маркер) подсветки синтаксиса.

Понимание SynEdit Highlighter

Взаимоотношения SynEdit - Highlighter

SynEdit - Highlighter имеют взаимоотношение N к 1.

  • Один экземпляр Highlighter может обслуживать N (много) экземпляров SynEdits
  • Каждый SynEdit имеет только один Highlighter
  • Но: один текст (текстовый буфер) может иметь много маркеров подсветки синтаксиса, если он используется несколькими SynEdit (каждый SynEdit будет иметь один HL, но все HL будут работать с одним и тем же документом)

В результате:

  • Экземпляр Highlighter не имеет (фиксированной) ссылки на SynEdit.
(Однако Highlighter'ы хранят список SynEditTextBuffers, к которому они прикреплены)
  • Все данные для Highlighter (должны быть) сохранены в SynEdit (фактически в TextBuffer SynEdit (называемом «Линии»).

Однако перед каждым вызовом Highlighter SynEdit гарантирует, что для Highlighter.CurrentLines будут установлены текущие строки SynEdits. Таким образом, маркер может получить доступ к данным в любое время. Формат хранения данных определяется маркером (TSynCustomHighlighter.AttachToLines).

Сканирование и возврат атрибутов подсветки

Ожидается, что Highlighter будет работать на основе каждой строки.

Если какой-либо текст был изменен, SynEdit будет вызывать (TSynCustomHighlighter.ScanFrom / в настоящее время вызывается из TSynEdit.ScanFrom) с диапазоном строк. Highlighter должен знать состояние предыдущей строки.

Если требуются атрибуты подсветки, SynEdit будет запрашивать их также для каждой строки. SynEdit будет проходить через отдельные токены на линии. В настоящее время это происходит из вложенных процедур PaintLines в SynEdit.PaintTextLines. Он вызывает TSynCustomHighlighter.StartAtLineIndex, за которым следует HL.GetTokenEx/HL.GetTokenAttribute до тех пор, пока HL.GetEol имеет значение false.

Кроме того, базовый класс для данных Highlighter'а (см. AttachToLines) основан на хранении данных на каждой строке, а TextBuffer (строки) SynEdit выполняет обслуживание этих данных для их синхронизации. То есть: всякий раз, когда строки текста вставляются или удаляются, записи также вставляются или удаляются из данных highlighter'ов (следовательно, в каждой строке должна быть одна запись).

Обычно Highlighter'ы сохраняют статус конца строки в этом поле. Поэтому, если Highlighter будет работать со строчкой, он продолжит ввод состояния из предыдущей строки.

Folding (сворачивание текста)

Событие фолдинга(схлопывания/сворачивание текста) SynEdit обрабатывается модулями SynEditFoldedView и SynGutterCodeFolding. Highlighter'ы, которые реализуют сворачивание, должны основываться на TSynCustomFoldHighlighter.

Базовая информация для связи между SynEditFoldedView и HL требует 2 значения, сохраненных для каждой строчки (конечно, сам highlighter может хранить больше информации):

  • FoldLevel в конце строки
  • Минимальный FoldLevel, встречающийся где-либо в строке

Foldlevel указывает, сколько (вложенных) уровней схлопывания/сворачивания текста существует. Он повышается всякий раз, когда уровень сворачивания начинается, и понижается, когда уровень сворачивания заканчивается:

                            EndLvl   MinLvl
  Procedure a;               1 -      0
  Begin                      2 --     1 -
    b:= 1;                   2 --     2 --
    if c > b then begin      3 ---    2 --
      c:=b;                  3 ---    3 ---
    end else begin           3 ---    2 --
      b:=c;                  3 ---    3 ---
    end;                     2 --     2 --
  end;                       0        0  // Оператор end закрывает оба уровня сворачивания текста: операторов                                                       
                                         //begin и procedure

На строке

Procedure a;               1 -      0

MinLvl равен 0, потому что строка началась с уровня 0 (и она никогда не спускалась / не закрывалась). Аналогично во всех строках, где есть только ключевое слово, открывающее уровень сворачивания текста ("begin").

А строка

    end else begin           3 ---    2 --

начинается с уровня 3, а также заканчивается им (один закрытый, один открытый). Но так как она спускается первой, минимальный уровень, встречающийся где-либо в строке, равен 2.

Без MinLvl было бы невозможно сказать, что уровень сворачивания текста заканчивается на этой строке.

MaxLvl не существует, потому что уровни сворачивания текста, начинающиеся и заканчивающиеся на одной и той же линии, не могут быть свернуты в любом случае. Не нужно их обнаруживать.

  if a then begin b:=1; c:=2; end; // нет уровня сворачивания текста на этой строке

Создание SynEdit Highlighter

Начиная с версии 0.9.31 rev.35115, сворачивание текста в highlighter'е изменилось. Реализовать базовое свертывание текста теперь проще.

Все исходники можно найти в каталоге установки Lazarus в: examples\SynEdit\NewHighlighterTutorial\

Проект HighlighterTutorial содержит 3 различных примера highlighter'ов:

  • SimpleHl: используется в шаге 1 ниже
  • ContextHl: используется в шаге 2 ниже
  • FoldHl: используется в шаге 3 ниже

SimpleHl и ContextHl тоже будут работать с v.0.9.30 Лазаруса

Сворачивание текста в highlighter'е в действии


Основы: возвращение токенов и атрибутов

Как указано, модуль SimpleHl демонстрирует этот процесс.

Что он делает

  • Он разбивает каждую строку на слова и пробелы (или табуляции)
    • Пробелы являются частью текста и также должны быть подсвечены
  • Этот пример позволяет указать разные цвета для
- текста (по умолчанию не подсвечен)
- пробелов (по умолчанию в серебристой рамке)
- слов, разделенных пробелами, начинающихся с a,e,i,o,u (по умолчанию выделены жирным шрифтом)
- "не" слов (по умолчанию на красном фоне)

Как это работает

  • Creation

Highlighter создает Атрибуты, которые могут вернуть Words(слова) и Spaces(пробелы).

  • SetLine

Событие вызывается SynEdit до того, как будет прорисована строка (или до того, как потребуется информация о выделении)

  • GetTokenEx, GetTokenAttribute, Next, GetEol

События используются SynEdit для перебора строки. Обратите внимание, что первый токен (слово или пробел) должен быть готов после SetLine, без вызова Next.

Light bulb  Примечание: токены, возвращаемые для каждой строки, должны представлять исходный текст строки и возвращаться в правильном порядке.
  • GetToken, GetTokenPos, GetTokenKind

SynEdit использует их, например, для поиска подходящих скобок. Если tokenKind возвращает разные значения для каждого атрибута, то скобки совпадают только в том случае, если они имеют одинаковый вид (например, если был строковый атрибут, скобки вне строки не будут совпадать с скобками внутри строки).

Другие заметки

Для удобства чтения highlighter не имеет оптимизации, поэтому он может быть очень медленным для больших текстов. Многие из поставляемых highlighter'ов используют хеш-функции, чтобы найти слово (или любую группу символов).

Step 2: Using Ranges

As indicated, the ContextHl unit demonstrates this process

The next example allows content of a line that influences other lines that follow. An example: a "(*" in Pascal makes all following lines a comment until a "*)" is found.

This example extends the SimpleHl show above: The tokens -- and ++ (must be surrounded by space or line-begin/end to be a token of their own) will toggle words that start with a,e,i,o,u

Multiple ++ and -- can be nested. Then for each -- a ++ must be given, before the words highlight again.

Then we extend the scanner. The pre-scan to store the information calls the same functions as the highlighter. It is automatically called, if anything changes. (It is called for all lines below the changed line, until a line returns the same Range-value as it already had)

The current amount of "--" is counted in

  FCurRange: Integer;

The amount is decreased by "++"

To store the info we use:

Called after a line is completely scanned, to get the value at the end of the line. The value will be stored.
Called before a line gets scanned. Sets the value stored from the end of the previous line.
Called before the 1st line is scanned (as there is no previous line).
Light bulb  Примечание: A scan is triggered by *every* change to a line (every keystroke). It scans the current line, and all lines below, until a line returns the same range that it already had. See: http://forum.lazarus.freepascal.org/index.php/topic,21727.msg139420.html#msg139420

Important note on Ranges

The purpose of the range is to allow the HL to start scanning in any line. The HL will not never need to look at a previous line. Any information needed to scan the current line can be derived from the ranges value.


  writeln; (*

when scanning the "readln" the HL knows from the range that it is in a comment, it does not need to look back at previous lines.

Therefore scanning can start at any line.

This also explains the note in the previous chapter. "until a line returns the same range that it already had". For even if the text of a line was not changed, if the value of the range at the lines start changed, then the scan result will change too.

Step 3: Add Folding

As indicated, the FoldHl unit demonstrates this process

For the example, the highlighter should fold everything between free-standing "-(-", "-)-".

Change inheritance:

  uses SynEditHighlighterFoldBase;
  TSynDemoHl = class(TSynCustomFoldHighlighter)

Change the way range info is stored, since the base class uses it for fold-info:

procedure TSynDemoHl.SetRange(Value: Pointer);
  FCurRange := PtrInt(CodeFoldRange.RangeType);

procedure TSynDemoHl.ResetRange;
  FCurRange := 0;

function TSynDemoHl.GetRange: Pointer;
  CodeFoldRange.RangeType := Pointer(PtrInt(FCurRange));

Now add code to the scanner which tells the highlighter about opening and closing folds:

procedure TSynDemoHl.FindTokenEnd;

  if (FTokenEnd = FTokenPos+1) and (FLineText[FTokenPos] = '[') then
  if (FTokenEnd = FTokenPos+1) and (FLineText[FTokenPos] = ']') then
  • For 0.9.30

Please see the history of this page, if you are using a 0.9.30 version [[1]]

More info on StartCodeFoldBlock / EndCodeFoldBlock

  function StartCodeFoldBlock(ABlockType: Pointer; IncreaseLevel: Boolean = true): TSynCustomCodeFoldBlock; virtual;
Can be used to specify an ID for the block.

The field is not normally used as a pointer (though this is permitted). Normally IDs are a numeric enumeration.
If you have different types of block (e.g. in Pascal: begin/end; repeat/until, ...), and you do not want a block being closed by the wrong keyword ("end" should not close "repeat"), then you can give them IDs:
StartCodeFoldBlock(PtrUInt(1)) // or other numbers

If set to False, then a block will be inserted that can not be folded.
Blocks like that can be used for internal tracking.

NOTE: All folds must be nested, they can not overlap. That is, the last opened fold must be closed first.
This refers to the "EndLvl" as shown in "Folding"(1.3) above
Overlaps (like IFDEF and begin in the IDE) can not be done this way.

  procedure EndCodeFoldBlock(DecreaseLevel: Boolean = True); virtual;
This *must* match IncreaseLevel, as it was given on the StartCodeFoldBlock

True means a fold ends; False means an internal block is ended. If mismatched then folds will either continue, or end early.
TopCodeFoldBlockType can be used to indicate the ID of the innermost open block. One can use different IDs for internal blocks, and use this to set the value.

  function TopCodeFoldBlockType(DownIndex: Integer = 0): Pointer;

Returns the ID of the innermost block.

can be used to get ID for the other block.

DownIndex=1 means the block that is surrounding the innermost.

Configurable Highlighters (incl. 3rd party)


A real simple Highlighter. More a reference implementation, than a real life useable Highlighter.


Flexible fully configurable Highlighter. https://github.com/t-edson/SynFacilSyn


Threads on the forum:

  • Folding
    • "SynEdit - improved highlighters to handle Code Folding?" [topic,7879]
    • "SynEdit - Add support code folding for Java" [topic,7338]
    • "CodeFolding" Config [topic,11064]
    • Fold blocks "end" keyword (end on the line before the next keyword) [topic,23411.msg139621]
    • Folding selected text from code (user/application code): [24473.msg147312]
    • Obtaining state of folding (save fold state with session) [topic=26748]