Diskussion "
Anführungszeichen Text gruppieren lassen

In einer Formulierung wie Siehe ->#oben. wird der Punkt als Satzzeichen nicht Teil des Links. Ähnliches wäre bei Anführungszeichen wünschenswert, also zum Beispiel in im "schwarzen ->#Saal" auch das Zeichen " nicht Teil des Links werden zu lassen. Darüber hinaus wäre wünschenswert, dass in im #"roten Raum" die ganze Wortgruppe mit Anführungszeichen zur Sprungmarke wird. Beides würde erreicht, wenn " wie ` Text gruppiert. Anders als ` und vergleichbar zu (…) würden die gruppierenden Anführungszeichen gedruckt.

  1. In den Überlegungen geht es zunächst um doppelte Anführungszeichen ("), also das Zeichen U+0022 QUOTATION MARK. Zwar ist der Gedanke naheliegend, auch einfache Anführungszeichen ('), also U+0027 APOSTROPHE, ebenso zu behandeln, doch der Unicode-Name legt schon nahe, dass dieses Zeichen meist Verwendung als alleinstehendes Apostroph-Zeichen findet, für das eine gruppierende Funktion unsinnig ist.

    Zu bedenken ist allerdings, dass auch das doppelte Anführungszeichen manchmal anders verwendet wird, beispielsweise als Zeichen für die Maßeinheit Zoll. Alleinstehende Anführungszeichen sollen daher ebenso wie alleinstehende Klammern keine Fehlermeldungen erzeugen. Es kann allerdings vorkommen, dass mehrere alleinstehende Anführungszeichen oder ein alleinstehendes Anführungszeichen sowie paarweise Anführungszeichen in einem Absatz stehen und fälschlich als paarweise auftretend interpretiert werden. In der Kombination mit anderem Markup kann das zu Fehlermeldungen führen, zum Beispiel:
    Wir brauchen ein ¾"-Rohr mit *Innendurchmesser ½"*.

    Zu beachten ist auch, dass der Vorschlag nur fürs doppelte Anführungszeichen aus dem ASCII-Bereich des Unicode-Standards gilt. „Typografisch zu bevorzugende“ doppelte Anführungszeichen wie in diesem Satz hätten in Aneamal keine gruppierende Funktion. Abgesehen davon, dass bislang absichtlich keine Zeichen außerhalb des ASCII-Bereichs eine besondere Funktion erhalten haben, wäre das auch äußerst schwierig angesichts der von Sprache zu Sprache oder von Land zu Land verschiedenenen Regeln oder von Mensch zu Mensch unterschiedlichen Vorlieben. So ist dasselbe Zeichen in Deutschland Endzeichen, was in England Anfangszeichen ist (“).

    Apropos Anfangs- und Endzeichen: U+0022 QUOTATION MARK unterscheidet nicht zwischen Anfang und Ende. Das heißt, anders als zum Beispiel Klammern können von Anführungszeichen gebildete Gruppen nicht geschachtelt werden. Es mag aber sein, dass Autoren es dennoch versuchen, insbesondere wenn Klammern und Anführungszeichen wie in folgendem Beispiel kombiniert sind und die Bedeutung dann klar erscheint:
    Er schrieb: "Bastian Schweinsteiger ("Schweini") won the World Cup in 2014."
    In diesem Beispiel würden vom Konverter zwei Gruppen, nämlich "Bastian Schweinsteiger (" und ") won the World Cup in 2014." identifiziert, was sicherlich nicht der Intention des Autors entspricht.

  2. Test me!

  3. Please!!

  4. What?

  5. My actual comment has been swallowed :-o spooky. No motivation to write all again. In short, what about

    «, <

    And

    Blabla (bla[blup] blplip) papklupp? Grouping effects there?

  6. Isn't it already the case that *, ~ string together words? What about <, «, ' ? Will they be detected as well?

    I'm not yet quite sure whether or not it's useful to rank elements that technically string together words (<b>, <i>, <span>) the same as semantically ones (").

    What about about the cases that interfere with nml? Say,

    Blabla (blablabla [bluppblupp] blabla) blippbluppplapp

    And what about glue letters such as - ? The letter - glues words together as

    Blabla motor-cycles->foo.bar

    Will it be rendered as

    <a href='foo.bar'>motor-cycles</a>

    ?

  7. @5: Your comment was put on hold for moderation, because it contained code typically found in SPAM. But I see that this can happen easily when discussing HTML etc. and is annoying then. So I have decreased the SPAM protection for the time being. Your comment can be found here: @6.

  8. > Isn't it already the case that *, ~ string together words?

    That’s correct. Currently the markup options *…*, ~…~, _…_, |…|, $…$, `…` create groups explicitly. Furthermore (…), […] also create groups explicitly without being special markup otherwise. "…" would also create a group explicitly without being special markup otherwise.

    Being a group means that when you attach an arrow (->) to its end, the whole thing will work as link text. Likewise, if you attach curly braces ({…}) to a group, the whole thing will be annoted with a hint. Likewise, when you prepend a hash sign (#) to a group, the whole thing will work as jump label. And there are some further effects of explicit group markup.

    > What about <, «, ' ? Will they be detected as well?

    The characters U+003C LESS-THAN SIGN (<) and U+0027 APOSTROPHE (') are signs that occur typically alone. Yep, they are also sometimes used as delimiters for a string of words that belong together – two apostrophes as 'single quotation marks' and a less-than sign together with a greater-than sign as faux angle brackets or chevrons or guillemets. But their main purposes, according to the Unicode standard, do not fit with the grouping concept. So I expect that making them group content would lead rather often to unexpected errors. For example, the following sentence would cause errors:
    Baby, don't say ~don't~.
    Why would it cause errors? Because the apostrophes would create a group ('t say ~don') that contains a single tilde (~) for italics, but tildes must come pairwise. Or put differently, the group created unintentionally by the apostrophes and the intended tilde markup for italics could not overlap like this. They would need to be properly nested.

    The character U+00AB LEFT-POINTING DOUBLE ANGLE QUOTATION MARK («) is a different story. Its purpose together with its mirrored sibling fits the concept of grouping words. However, its Unicode codepoint is above U+0079, so not inside the ASCII range. So far Aneamal doesn’t handle anything non-ASCII in any special way. Starting to handle non-ASCII characters in a particular way here would open a big can of worms. Numerous other characters would creep out and ask for the same special treatment.

    So I tend to make non of the three characters < and « and ' group content.

    > What about about the cases that interfere with nml? Say,
    > Blabla (blablabla [bluppblupp] blabla) blippbluppplapp

    That example is fine – no problem for Aneamal. Both (…) and […] group their respective contents, but that has no consequence here. The groups are not used as link text or anything else special and they don’t have to. The Aneamal-HTML-converter would output that line just like it went in.

    > And what about glue letters such as - ? The letter - glues words together as
    > Blabla motor-cycles->foo.bar
    > Will it be rendered as
    > <a href='foo.bar'>motor-cycles</a>

    Yeah, the character 002D HYPHEN-MINUS (-) connects words – unless it is followed immediately by 003E GREATER-THAN SIGN (>), because together (->) they form an arrow which creates a hyperlink.

  9. Tiny correction for @8: The ASCII range goes to U+007F.

  10. (I am a link)->foo.bar --> is rendered as

    a href foo.bar (I am a link) / a

    ?

  11. Yes, (I am a link)->foo.bar in Aneamal is roughly turned into <a href='foo.bar'>(I am a link)</a> in HTML, except that the URL may also get a bit modified, e.g. <a href='/examples/foo.bar'>(I am a link)</a>.

  12. Anführungszeichen "…" Text gruppieren zu lassen ist nun für die nächste Aneamal-Version (Anfang 2019) vorgesehen.

  13. Anführungszeichen "…" Text gruppieren zu lassen funktioniert nun im Testbetrieb. :-)

  14. Ich schließe die Diskussion, da die Funktion implementiert wurde.
    Siehe auch: https://prlbr.de/projekt/aneamal/diskussion/anfuehrungszeichen-ueberladen