Original source: http://www.cs.engr.uky.edu/~raphael/yiddish/unix.html
Autor: Raphael Finkel. correo electrónico (sin guión bajo), web .
Índice de contenidos: Opciones | Problemas | Fuentes | xkb | xterm | Yudita | Vim | AbiPalabra | mula | emacs | KDE | Resumen | Referencias |
El software sigue cambiando, por lo que es posible que las recomendaciones de este documento, que se redactó por primera vez alrededor de 2005, ya no estén actualizadas.
Opciones
Para escribir yiddish en Unix, tienes estas opciones:
- Escribe en transliteración YIVO y conviértela, si lo deseas, a alguna otra forma usando shraybmashinke .
- Escribe directamente en Unicode, almacenando tu archivo en formato UTF-8.
Esta nota se concentra en las formas de hacer esto último. Realmente querrás usar Unicode a largo plazo, porque te permite combinar varios idiomas en un solo documento y define el formato de presentación, en particular, el diseño bidireccional.
Asuntos
- ¿ A qué nivel de software se realiza la conversión de pulsaciones de teclas en representación de caracteres?
- En el “modo consola” de Unix, el controlador del dispositivo realiza la asignación.
- En la “entrada de X-windows” de Unix, el servidor X tiene una tabla de mapa de teclas para convertir códigos de teclas de eventos (eventos de pulsación de teclas) en símbolos de teclas. Hay una lista de símbolos de claves en include/X11/keysymdef.h , que viene con distribuciones X; define árabe, tailandés, hebreo y otros símbolos clave. A la lista hebrea le faltan los caracteres especiales yiddish. No te recomiendo que juegues con símbolos clave hebreos o yiddish; los valores de keyym son específicos de X-Windows y no corresponden a Unicode. Sin embargo, algunas aplicaciones (como xterm) entienden un símbolo de clave de la forma 0x100XXXX como el carácter Unicode UCS-2 XXXX.
- Puede habilitar la extensión de teclado X ( xkb ) para permitirle cambiar entre diseños de teclado e interpretar sus pulsaciones de teclas como yiddish en el diseño apropiado.
- Puede utilizar los métodos IBUS, SCIM, UIM. En instalaciones de Debian (incluido Ubuntu), use apt-get para obtener estos paquetes: ibus , ibus-m17n , libm17n-0 , m17n-contrib , ibus-gtk . Ejecute ibus-setup y elija Yiddish-yivo (m17n) como método de entrada. Ahora cualquier programa que utilice IBUS puede recibir entradas; alternas entre tu entrada habitual e IBUS con <control-space> (puedes personalizarlo).
- Si prefiere la distribución del teclado de Yankl Halpern , puede tomar este archivo e instalarlo en el directorio impreso ejecutando /usr/bin/m17n-db (deberá hacerlo como root). Entonces deberías ejecutar ibus-daemon -d –xim –cache refresco (como tú mismo).
- Puede introducir un método de entrada X (XIM). Algunas aplicaciones de X-Windows pueden utilizar esta técnica.
- Puede introducir un método de entrada en la biblioteca gtk+. Este método se puede habilitar en cualquier aplicación gnome, como gedit . Los métodos de entrada permiten traducciones de múltiples claves sensibles al contexto.
- Aplicaciones como Yudit y Vim pueden aplicar sus propias asignaciones.
- ¿ Puede el usuario configurar el mapeo? En la “entrada X-Windows” de Unix, el programa xmodmap puede modificar la tabla del mapa de teclas. El programa xkeycaps puede ayudarle a configurar su configuración de xmodmap de forma interactiva. De manera similar, algunas aplicaciones X basadas en recursos X, en particular xterm (el emulador de terminal), se pueden configurar para traducir claves particulares de la forma deseada. Sin embargo, en muchos casos, necesitará permisos especiales para modificar los archivos de configuración.
- ¿ Puede el usuario cambiar fácilmente de un mapeo a otro? En Unix, xmodmap puede cambiar la tabla del mapa de teclas sobre la marcha (lo que afecta a todas las aplicaciones). Las asignaciones específicas de la aplicación X generalmente se cargan solo cuando se inicia la aplicación. Sin embargo, xterm permite asignar una clave a una función como “cambiar a un mapa cargado diferente”. Xkb le permite establecer una clave o un grupo de claves que le permite cambiar diseños. IBUS le permite cambiar entre métodos de entrada. Yudit hace su propio mapeo y con solo presionar una tecla se cambia de uno a otro. Vim hace su propio mapeo y un comando simple (que puede ser mapeado con una pulsación de tecla) cambia de uno a otro.
- ¿ Las asignaciones permiten traducciones de múltiples claves? Cuando escribo yiddish, me gustaría que “w” fuera shin, pero también quiero que “sh” sea shin, porque mi lengua materna es el inglés. Quiero que “n” me dé una monja final y una coma. En Unix, las traducciones de claves múltiples no están disponibles en el nivel del kernel o de X-windows (hasta donde yo sé), pero son posibles en IBUS, módulos de entrada gtk+ y algunas aplicaciones, en particular, Yudit y Vim .
- ¿Es Unicode (UTF-8) el formato para el almacenamiento de datos? Esta pregunta suele depender de la aplicación. En Unix, Yudit solo usa Unicode, y Vim se puede configurar para usar Unicode (y traducirlo desde otras codificaciones). En la variante Linux de Unix, en “modo consola”, las aplicaciones reciben caracteres Unicode (creo).
- ¿Existen fuentes que muestren Unicode correctamente, en particular las letras específicas del yiddish, como pasekh-tsvey-yudn? Desde el año 2000, la respuesta es cada vez más afirmativa en todas las plataformas. Ver fuentes , a continuación.
- ¿Los motores de visualización y los editores manejan adecuadamente la composición de personajes? En Unix, el servidor X-Windows aparentemente no tiene tal soporte, pero algunas aplicaciones (como xterm y Yudit ) muestran caracteres precompuestos equivalentes cuando están disponibles y usan superposición simple en caso contrario. Gvim (la versión gráfica de vim que omite xterm ) solo usa superposición. Vim comprende la naturaleza de la composición con ancho 0 (solo trata con fuentes monoespaciadas y, por lo tanto, la alineación vertical es importante).
- ¿Los motores de visualización manejan la bidireccionalidad ? Hay varios niveles de capacidad: (a) sin soporte, (b) una ventana completa se puede configurar manualmente en RTL, (c) un fragmento de texto dentro de una ventana se puede configurar manualmente en RTL, (d) todo el texto se configura automáticamente mostrado de acuerdo con un algoritmo bidireccional completo (BIDI). Normalmente, los motores de visualización son parte de la aplicación de nivel superior (es decir, en Unix, cuando uso Vim a través de xterm a través de X-Windows a través del sistema operativo, es Vim quien decide cómo distribuir los caracteres. Los niveles inferiores no ofrecen soporte) . El estado actual (2003) en Unix es que Vim usa el método (b), Yudit y el método AbiWord (d).
- ¿Es posible ingresar directamente un valor Unicode? algunas aplicaciones tienen esta capacidad: Vim (escribe <ctr-V>u05d7 para obtener un khes) y Yudit (cambias al mapa de teclas “unicode” y escribes u05d7 ). No es compatible con niveles inferiores (todavía).
- ¿Existe un procesador de interfaz de usuario independiente de la aplicación que pueda convertir las pulsaciones de teclas en caracteres Unicode para cualquier aplicación que se esté ejecutando? En X-Windows, dicho procesador se denomina método de entrada X (XIM). Muchas aplicaciones, incluidas Gvim, AbiWord y Yudit, se pueden adjuntar a un XIM; Yudit puede cambiar entre varios XIM durante una sesión. He creado un XIM en yiddish, pero solo logra hablar con AbiWord .
- ¿Es posible internacionalizar aplicaciones, es decir, tener mensajes de error, pantallas de ayuda y etiquetas de botones en tu idioma favorito? En Unix, los programas compilados con libintl se pueden internacionalizar. He escrito las traducciones necesarias para Yudit y para AbiWord .
- ¿ Se puede revisar la ortografía insertando listas ortográficas personalizadas? En Vim y AbiWord , la respuesta es sí, tanto en yiddish romanizado como en Unicode. He creado estas listas de ortografía.
Fuentes
En Unix, utilizará el sistema X-Windows. Le recomiendo que obtenga las fuentes de Markus Kuhn si aún no las tiene en su distribución de X-Windows. Están presentes en X11R6.4. La fuente -misc-fixed-medium-r-normal–20-200-75-75-c-100-iso10646-1 tiene mis modificaciones para que sea completa y legible en yiddish. Para fuentes TrueType, recomiendo FreeSans.
xkb
En lugar de utilizar mapas de teclas de X-Windows, puede utilizar la extensión de teclado X, conocida como xkb . Esta función le permite establecer varias distribuciones de teclado y alternar entre ellas. Esta función es independiente de todas las aplicaciones de X-Windows. No le ofrece traducciones de varias claves. Aquí hay instrucciones para Ubuntu Linux.
- Asegúrese de no tener XKB_DISABLE configurado en su variable de entorno.
- Como root, agregue a /usr/share/X11/xkb/symbols/us el contenido de este archivo .
- En /usr/share/X11/xkb/rules , coloque la siguiente línea al final de la sección us: (alrededor de la línea 269) de base.lst y evdev.lst :yiddish nosotros: yiddish
- En /usr/share/X11/xkb/rules , coloque la siguiente línea dentro de “us” <layout>, en la lista de variantes después de la variante fonética rusa, tanto en base.xml como en evdev.xm : <variante> <artículo de configuración> <nombre>yídish</nombre> <descripción>Yiddish</descripción> <languageList><iso639Id>yid</iso639Id></languageList> </configItem> </variante>
- Ejecute setxkbmap con nosotros
- Usando gnome-keyboard-properties , en la pestaña “Diseños”,
- Agregar un diseño: Por idioma → Yiddish → EE.UU. Yiddish
- Configure las Opciones de diseño para conocer las claves para cambiar el diseño. Es posible que desee utilizar el LED del teclado para mostrar un diseño alternativo.
- Ejecute setxkbmap -option grp:switch,grp:alts_toggle
- Ahora puede usar (1) lo que haya configurado en el paso anterior para cambiar diseños, (2) la tecla Mayús para cambiar niveles y (3) la tecla Alt derecha para cambiar grupos (algunas teclas tienen un segundo grupo de símbolos). ). El teclado se parece a este archivo pdf . Si necesita escribir letras no precompuestas, separando un alef de su pasekh, por ejemplo, use las vocales ubicadas en la tecla Q o los símbolos del grupo dos en otras teclas.
xterm
Las versiones de xterm desde 2000 entienden UTF-8. Puede obtener xterm y compilarlo usted mismo si lo necesita; debes estipular ./configure –enable-wide-chars . Limitaciones/errores: Xterm no tiene soporte BIDI. Compone caracteres mediante simple sobreimpresión a menos que pueda encontrar un carácter precompuesto. Coloca caracteres precompuestos en el búfer de corte, no poscompuestos, como debería. Archivo de soporte: Es posible que desee agregar esta información a su archivo ~/.Xdefaults para admitir (1) una fuente Unicode agradable (con un tamaño de fuente “medio” y (2) una codificación de teclado para yiddish (activar/desactivar con el interruptor Mode_switch). llave).
yudit
El editor Yudit de Gaspar Sinai te permite editar texto UTF-8. Aquí hay una captura de pantalla . He creado una asignación de teclado que forma parte de la distribución. Este mapeo tiene un procesador frontal de múltiples claves, por lo que puedes escribir “sh” si quieres un shin. El mapeo yiddish también inserta shtumer alef después de un espacio antes de ciertas vocales. Yudit también funciona con mi XIM. Yudit tiene su propio motor de visualización de fuentes truetype, por lo que no es necesario tener uno en su X11. Yudit tiene internacionalización, por lo que puede presentar todos los mensajes del editor en yiddish. Yudit hace una verdadera visualización BIDI. Necesitará configurar su archivo ~/.yudit/yudit.properties para que tenga líneas como esta:
yudit.default.language=yi yudit.editor.font=iso10646 yudit.editor.fonts=arial,cyberbit,iso10646,caslr yudit.editor.fontsize=20 | yudit.editor.fontsizes=10,12,14,16,20,24 yudit.editor.input=Yídish yudit.editor.inputs=directo,unicode,yiddish,ruso,alemán yudit.font.arial=arial__h.ttf,cyberbit.ttf yudit.font.caslr=caslr.ttf yudit.font.cyberbit=cyberbit.ttf,CyberBitMods.ttf yudit.font.iso10646=-misceláneo-medio-fijo-r-normal–20-200-75-75-c-100-iso10646-1 yudit.editor.fonts=arial,cyberbit,iso10646,caslr
Es posible que desees la fuente Cyberbit . Faltan algunos caracteres, que puedes obtener agregando CyberBitMods a las rutas de fuentes. Es posible que también desees la fuente caslr, aunque no es tan bonita para el yiddish. Yudit es capaz de generar resultados PostScript. Existe una versión de Yudit que se ejecuta en plataformas Win32 que puedes encontrar aquí . Breves instrucciones de instalación de Win32: (1) Ejecute el ejecutable que descargue para instalar el programa (su nombre coincide con este patrón: yudit*.exe (2) Instale las fuentes de mapa de bits ejecutando el programa que coincida con este patrón: bitmap_fonts*.exe (3 ) Utilizando cualquier editor de texto, modifique Archivos de programa\Yudit\Config\yudit.properties de la siguiente manera:
yudit.datapath=C:\Program Files\Yudit\datayudit.fontpath=C:\WINNT\FONTS [para Win2000]yudit.fontpath=C:\WINDOES\FONTS [para Win98]
Empuje
El editor Vim de Bram Moolenaar es una versión gratuita del siempre popular editor vi; Funciona bien tanto en Unix como en Win32. A partir de la versión 6.0, tiene bastante buen soporte para Unicode y Yiddish. Úselo junto con xterm (como arriba) o en modo gvim (sin pasar por xterm) para obtener el beneficio completo. Aquí hay una captura de pantalla de la interfaz gvim. No necesitas el material de mapeo de caracteres especiales para xterm; utilice un mapa de teclas Vim en su lugar. Coloque estos comandos en ~/.vimrc:
setfileencodings=cp1255,utf-8 guifont=8x13codificación en negrita=utf-8 complemento de tipo de archivo activado sintaxis en
Querrá saber acerca de los siguientes comandos:
:set rl establece el modo en la ventana actual en RTL : establece el modo norl en la ventana actual en LTR :set keymap=yi cambia al mapa de teclas yiddish :set encoding=utf-8 permite que Vim genere bien en su xterm habilitado para UTF-8 <control-^> alterna el modo de entrada de idioma extranjero.
Si planea mezclar idiomas, le sugiero que utilice varias ventanas, una con rtl activado y la otra sin él. Limitaciones/errores: Vim no tiene soporte BIDI y es poco probable que lo obtenga. Archivo de soporte: obtenga este archivo y descomprímalo en su directorio de inicio. Incluye corrector ortográfico para yiddish romanizado y Unicode y macros de teclado (un procesador frontal completo) para yiddish Unicode. Requiere al menos la versión 6.0. Lea el archivo README (tiene instrucciones para Unix y Win32).
AbiWord
AbiWord es (eventualmente) un procesador de textos con todas las funciones, no solo un editor de texto. Utiliza XML como formato de archivo preferido, pero puede importar y exportar archivos formateados y archivos de texto en Unicode. Las versiones más recientes del procesador de textos AbiWord manejan BIDI. También pueden dar forma a las letras hebreas, lo que significa que las letras finales se generan automáticamente, pero el archivo resultante contiene letras mediales, no finales; deje esta función desactivada. AbiWord tiene versiones para Unix, MacOS y Win32; todos tienen una apariencia similar.
Gran parte de lo siguiente está obsoleto; AbiWord es un objetivo que se mueve rápidamente. Es complicado configurar las fuentes de AbiWord para Unix/X-Windows.
- En su directorio de fuentes (normalmente /usr/share/AbiSuite/fonts , necesita crear un subdirectorio utf-8.
- Coloque allí una copia o un enlace a fuentes razonables de tipo verdadero, como arial.ttf.
- Ejecute ttmkfdir en ese directorio (encuentre ttmkfdir aquí ). Este programa extrae nombres de fuentes de sus archivos ttf y crea fonts.scale.
- En el archivo resultante fonts.scale , cree una nueva línea para cada fuente (probablemente ya habrá varias con nombres de codificación ligeramente diferentes). En esta nueva línea, establezca la codificación, que es el sufijo -iso, para que diga iso10646-1. Este sufijo dice “Soy una fuente Unicode”.
- Ejecute mkfontdir en ese directorio. Este programa construye fonts.dir , que X-Windows necesita para comprender el contenido.
- En el directorio bin de AbiWord, normalmente /usr/share/AbiSuite/bin , ejecute ttfadmin.sh /usr/share/AbiSuite/fonts/utf-8 ISO-10646-1 . Este programa establece archivos auxiliares *.u2g y *.t42 para cada fuente. AbiWord necesita esos archivos auxiliares para comprender las fuentes.
- Su servidor X-Windows debe comprender tanto los tipos de fuentes utilizados habitualmente por AbiWord como también las fuentes True Type, porque sólo la fuente Arial True Type, hasta donde yo sé, está ampliamente disponible y es compatible con el yiddish. Necesita al menos la versión 4.1.0 de X-Windows. En su archivo de configuración (normalmente /etc/XF86Config ), debe tener Cargar “tipo1” Cargar “xtt” en la sección “Módulo”. Si tiene que agregar esas líneas, debe reiniciar X-Windows para que los cambios surtan efecto.
- Cada vez que ejecute AbiWord, primero debe configurar su variable de entorno LANG en yi.utf-8 . La parte .utf-8 indica qué fuente configurada usar. La primera parte dice: “Prefiero el yiddish en todo momento”.
- Cuando lea un archivo de texto UTF-8, léalo como texto codificado y luego seleccione la codificación UTF8 en el cuadro de diálogo resultante.
- No conozco una buena manera de asignar el teclado. Utilizo xmodmap y cambio entre mapas en inglés y yiddish. Sin embargo, esta técnica requiere que utilices varias pulsaciones de teclas para obtener vocales en un alef o líneas encima de un beys o cualquier otro carácter con múltiples utf8. Puedo darte los archivos xmodmap relevantes y un pequeño programa tk que te permite alternar entre ellos.
- Cuando sale de AbiWord, necesita desarmar la variable LANG y también eliminar directorios adicionales de su ruta de fuente que AbiWord a veces deja por ahí: xset fp- /usr/share/AbiSuite/fonts/ y xset fp- /usr/share/AbiSuite/ fuentes/utf-8/ .
Estoy trabajando en un corrector ortográfico para AbiWord/Yiddish. Tengo archivos de revisión ortográfica; Pregúntame para más detalles. Actualmente existen los siguientes problemas:
- Lograr que AbiWord comprenda los archivos de corrección ortográfica de idiomas como el yiddish que no están en su lista actual. Simplemente los llamo archivos finlandeses y configuro mi idioma en finlandés.
- El menú interactivo cuando se encuentra un error ortográfico utiliza una fuente que no es utf8, por lo que todo lo que ve es un galimatías.
mula
Mule 2.3 es una extensión del editor Gnu emacs 19.28. No es compatible con Unicode, pero sí con varias páginas de códigos específicos del idioma. Utiliza su propio formato de archivo peculiar “junet” para archivos multilenguaje. Te aconsejo que lo evites.
emacs
Existe una versión experimental (10/2003) de emacs que maneja UTF8 y, según se informa, maneja BIDI bastante bien; Está en http://www.m17n.org/emacs-bidi/ . Emacs es un editor con todas las funciones, pero se necesita mucho esfuerzo para aprenderlo. Actualización (7/2008): si bien la compatibilidad con BiDi aún no está disponible para Emacs (excepto el experimental y que ejecuta emacs -nw (sin gráficos) en un emulador de terminal compatible con BiDi), puede utilizar pobre-mans-bidi .el , que ejecuta las herramientas de línea de comandos fribidi o bidiv como un subproceso para transformar la entrada lógica en salida visual en un búfer reflejado. También hay un método de entrada para yiddish en Emacs que maneja una entrada similar a YIVO, entre otros, escrito por Niels Giesen. En agosto de 2010, una rama de desarrollo de Emacs admite la visualización bidireccional y deja obsoleto a los pobres-hombres-bidi.
KDE
KDE 3 es un “entorno”, que incluye un administrador de ventanas y muchas aplicaciones. Su aplicación de procesamiento de textos se llama KOffice. KOffice admite BIDI y varias codificaciones, incluido Unicode.
Resumen
Producto | BIDI | asignaciones de teclado | nivel de editor |
xterm | ninguno | llave única | sin edición |
Empuje | manual por buffer; solo afecta la visualización | clave múltiple; buena transcripción YIVO | edición completa (use mi complemento de revisión ortográfica para yiddish romanizado o Unicode); sólo texto plano; visualización monoespaciada únicamente |
yudit | automático; solo afecta la visualización | clave múltiple; buena transcripción YIVO | edición aceptable; sólo texto plano; permite fuentes True Type y no monoespaciadas; genera PostScript. |
KOficina | ? | ? | “procesamiento de textos” completo; inserta códigos de formato; puede generar texto sin formato o XML o algunas otras formas. |
AbiPalabra | automático; solo afecta la visualización | No | “procesamiento de textos” completo; inserta códigos de formato; puede generar texto sin formato o XML o algunas otras formas. |
Referencias
- Preguntas frecuentes sobre UTF-8 y Unicode para Unix
- Comprender el procesamiento de información en yiddish en general .

I’ve always been captivated by the wonders of science, particularly the intricate workings of the human mind. With a degree in psychology under my belt, I’ve delved deep into the realms of cognition, behavior, and everything in between. Pouring over academic papers and research studies has become somewhat of a passion of mine – there’s just something exhilarating about uncovering new insights and perspectives.