Verificar dígito - Check digit

Un dígito de control es una forma de verificación de redundancia que se utiliza para la detección de errores en los números de identificación, como los números de cuentas bancarias, que se utilizan en una aplicación en la que al menos a veces se introducirán manualmente. Es análogo a un bit de paridad binario que se usa para verificar errores en los datos generados por computadora. Consiste en uno o más dígitos (o letras) calculados por un algoritmo a partir de los otros dígitos (o letras) en la secuencia de entrada.

Con un dígito de control, se pueden detectar errores simples en la entrada de una serie de caracteres (generalmente dígitos) como un solo dígito mal escrito o algunas permutaciones de dos dígitos sucesivos.

Diseño

Los algoritmos de dígitos de control generalmente están diseñados para capturar errores de transcripción humana . En orden de complejidad, estos incluyen lo siguiente:

  • Errores de letras / dígitos, como l → 1 o O → 0
  • errores de un solo dígito, como 1 → 2
  • errores de transposición, como 12 → 21
  • errores gemelos, como 11 → 22
  • errores de transposiciones de salto, como 132 → 231
  • Saltar errores gemelos, como 131 → 232
  • errores fonéticos, como 60 → 16 ("sesenta" a "dieciséis")

Al elegir un sistema, una alta probabilidad de detectar errores se compensa con la dificultad de implementación; Los humanos entienden e implementan fácilmente los sistemas simples de dígitos de control, pero no detectan tantos errores como los complejos, que requieren programas sofisticados para su implementación.

Una característica deseable es que el relleno a la izquierda con ceros no debería cambiar el dígito de control. Esto permite utilizar números de longitud variable y cambiar la longitud. Si se agrega un solo dígito de control al número original, el sistema no siempre capturará múltiples errores, como dos errores de reemplazo (12 → 34), aunque, por lo general, los errores dobles se detectarán el 90% de las veces (ambos cambios necesidad de cambiar la salida compensando las cantidades).

Un método de dígitos de control muy simple sería tomar la suma de todos los dígitos ( suma digital ) módulo 10. Esto detectaría cualquier error de un solo dígito, ya que dicho error siempre cambiaría la suma, pero no detectaría ningún error de transposición (cambio dos dígitos) ya que reordenar no cambia la suma.

Un método un poco más complejo es tomar la suma ponderada de los dígitos, módulo 10, con diferentes pesos para cada posición numérica.

Para ilustrar esto, por ejemplo, si los pesos de un número de cuatro dígitos fueran 5, 3, 2, 7 y el número a codificar fuera 4871, entonces se tomaría 5 × 4 + 3 × 8 + 2 × 7 + 7 × 1 = 65, es decir, 65 módulo 10, y el dígito de control sería 5, dando 48715.

Los sistemas con pesos de 1, 3, 7 o 9, donde los pesos de los números vecinos son diferentes, se utilizan ampliamente: por ejemplo, 31 31 pesos en códigos UPC , 13 13 pesos en números EAN (algoritmo GS1) y 371 371 371 pesos utilizados en los números de tránsito bancarios de los bancos de los Estados Unidos . Este sistema detecta todos los errores de un solo dígito y alrededor del 90% de los errores de transposición. 1, 3, 7 y 9 se utilizan porque son coprimeras con 10, por lo que cambiar cualquier dígito cambia el dígito de control; el uso de un coeficiente que es divisible por 2 o 5 perdería información (porque 5 × 0 = 5 × 2 = 5 × 4 = 5 × 6 = 5 × 8 = 0 módulo 10) y, por lo tanto, no detectaría algunos errores de un solo dígito. El uso de diferentes pesos en números vecinos significa que la mayoría de las transposiciones cambian el dígito de control; sin embargo, debido a que todos los pesos difieren en un número par, esto no detecta transposiciones de dos dígitos que difieren en 5, (0 y 5, 1 y 6, 2 y 7, 3 y 8, 4 y 9), ya que el 2 y 5 multiplica para obtener 10.

En cambio, el código ISBN-10 usa módulo 11, que es primo, y todas las posiciones numéricas tienen diferentes pesos 1, 2, ... 10. Este sistema detecta todos los errores de sustitución y transposición de un solo dígito (incluidas las transposiciones de salto), pero en el costo del dígito de control posiblemente sea 10, representado por "X". (Una alternativa es simplemente evitar el uso de números de serie que resultan en un dígito de control "X".) ISBN-13 en su lugar usa el algoritmo GS1 usado en los números EAN.

Los algoritmos más complicados incluyen el algoritmo de Luhn (1954), que captura el 98% de los errores de transposición de un solo dígito (no detecta 90 ↔ 09) y el algoritmo de Verhoeff (1969), aún más sofisticado , que captura todos los errores de transposición y sustitución de un solo dígito, y muchos (pero no todos) errores más complejos. Similar es otro método basado en álgebra abstracta , el algoritmo Damm (2004), que también detecta todos los errores de un solo dígito y todos los errores de transposición adyacentes. Estos tres métodos utilizan un solo dígito de control y, por lo tanto, no capturarán alrededor del 10% de los errores más complejos. Para reducir esta tasa de fallas, es necesario usar más de un dígito de control (por ejemplo, el control de módulo 97 mencionado a continuación, que usa dos dígitos de control; para el algoritmo, consulte Número de cuenta bancaria internacional ) y / o usar un una gama más amplia de caracteres en el dígito de control, por ejemplo, letras más números.

Ejemplos de

UPC

El último dígito de un código de producto universal es un dígito de control calculado de la siguiente manera:

  1. Sume los dígitos en las posiciones impares desde la derecha (primero, tercero, quinto, etc., sin incluir el dígito de control) y multiplique por tres.
  2. Agregue los dígitos (hasta pero sin incluir el dígito de control) en las posiciones pares (segundo, cuarto, sexto, etc.) al resultado.
  3. Tome el resto del resultado dividido por 10 (es decir, la operación de módulo 10). Si el resto es igual a 0, utilice 0 como dígito de control y, si no es 0, reste el resto de 10 para obtener el dígito de control.

Por ejemplo, el código de barras UPC-A para una caja de pañuelos es "036000241457". El último dígito es el dígito de control "7", y si los otros números son correctos, el cálculo del dígito de control debe producir 7.

  1. Suma los dígitos de los números impares: 0 + 6 + 0 + 2 + 1 + 5 = 14.
  2. Multiplica el resultado por 3:14 × 3 = 42.
  3. Suma los dígitos de los números pares: 3 + 0 + 0 + 4 + 4 = 11.
  4. Suma los dos resultados: 42 + 11 = 53.
  5. Para calcular el dígito de control, tome el resto de (53/10), que también se conoce como (53 módulo 10), y si no es 0, reste de 10. Por lo tanto, el valor del dígito de control es 7. es decir (53/10 ) = 5 resto 3; 10 - 3 = 7.

Otro ejemplo: para calcular el dígito de control para el siguiente alimento "01010101010 x ".

  1. Suma los dígitos impares: 0 + 0 + 0 + 0 + 0 + 0 = 0.
  2. Multiplica el resultado por 3: 0 x 3 = 0.
  3. Suma los dígitos de los números pares: 1 + 1 + 1 + 1 + 1 = 5.
  4. Suma los dos resultados: 0 + 5 = 5.
  5. Para calcular el dígito de control, tome el resto de (5/10), que también se conoce como (5 módulo 10), y si no es 0, reste de 10: es decir (5/10) = 0 resto 5; (10 - 5) = 5. Por lo tanto, el valor x del dígito de control es 5.

ISBN 10

El carácter final de un Número de libro estándar internacional de diez dígitos es un dígito de control calculado de manera que multiplicando cada dígito por su posición en el número (contando desde la derecha) y tomando la suma de estos productos módulo 11 es 0. El dígito más lejano a la derecha (que se multiplica por 1) está el dígito de control, elegido para que la suma sea correcta. Es posible que deba tener el valor 10, que se representa como la letra X. Por ejemplo, tome el ISBN  0-201-53082-1 : La suma de productos es 0 × 10 + 2 × 9 + 0 × 8 + 1 × 7 + 5 × 6 + 3 × 5 + 0 × 4 + 8 × 3 + 2 × 2 + 1 × 1 = 99 ≡ 0 (mod 11). Entonces el ISBN es válido. Tenga en cuenta que las posiciones también se pueden contar desde la izquierda, en cuyo caso el dígito de control se multiplica por 10, para verificar la validez: 0 × 1 + 2 × 2 + 0 × 3 + 1 × 4 + 5 × 5 + 3 × 6 + 0 × 7 + 8 × 8 + 2 × 9 + 1 × 10 = 143 ≡ 0 (mod 11).

ISBN 13

ISBN 13 (en uso en enero de 2007) es igual al código EAN-13 que se encuentra debajo del código de barras de un libro. Su dígito de control se genera de la misma manera que el UPC excepto que los dígitos pares se multiplican por 3 en lugar de los dígitos impares.

EAN (GLN, GTIN, números EAN administrados por GS1)

Los dígitos de control EAN ( Número de artículo europeo ) (administrados por GS1 ) se calculan sumando cada uno de los números de posición impares multiplicados por 3 y luego sumando la suma de los números de posición pares. Los números se examinan de derecha a izquierda, por lo que la primera posición impar es el último dígito del código. El dígito final del resultado se resta de 10 para calcular el dígito de control (o se deja como está si ya es cero). Una calculadora de dígitos de control GS1 y documentación detallada están en línea en el sitio web de GS1 . Otra página oficial de la calculadora muestra que el mecanismo para GTIN-13 es el mismo para el Número de ubicación global / GLN.

NCDA

El algoritmo de dígitos de control NOID (NCDA), en uso desde 2004, está diseñado para su aplicación en identificadores persistentes y funciona con cadenas de letras y dígitos de longitud variable, llamadas dígitos extendidos. Se usa ampliamente con el esquema de identificador ARK y algo usado con esquemas, como el Sistema de Manejo y DOI . Un dígito extendido está limitado a caracteres betanuméricos , que son alfanuméricos menos vocales y la letra 'l' (ell). Esta restricción ayuda cuando se generan cadenas opacas que es poco probable que formen palabras por accidente y que no contengan tanto O como 0, ol y 1. Teniendo una raíz prima de R = 29, el repertorio betanumérico permite que el algoritmo garantice la detección de una sola errores de carácter y transposición para cadenas de menos de R = 29 caracteres de longitud (más allá de los cuales proporciona una comprobación un poco más débil). El algoritmo se generaliza a cualquier repertorio de caracteres con una raíz principal R y cadenas de menos de R caracteres de longitud.

Otros ejemplos de dígitos de control

Internacional

En los EE.UU

En Centroamérica

  • El Número Tributario de Guatemala (NIT - Número de Identificación Tributaria) basado en el módulo 11.

En eurasia

En Oceanía

Algoritmos

Los algoritmos notables incluyen:

Ver también

Referencias

enlaces externos

  • Números de identificación y esquemas de dígitos de control (una explicación matemática de varios esquemas de dígitos de control)
  • Calculadora de dígitos de control UPC, EAN y SCC-14
  • Calculadora de dígitos de control GS1