Factorización de enteros - Integer factorization

Problema no resuelto en informática :

¿Se puede resolver la factorización de enteros en tiempo polinomial en una computadora clásica?

(más problemas sin resolver en informática)

En teoría de números , la factorización de enteros es la descomposición de un número compuesto en un producto de números enteros más pequeños. Si estos factores se restringen aún más a números primos , el proceso se denomina factorización prima .

Cuando los números son lo suficientemente grandes, no se conoce ningún algoritmo de factorización de enteros no cuántico eficiente . Sin embargo, no se ha demostrado que no exista un algoritmo eficaz. La presunta dificultad de este problema está en el corazón de los algoritmos ampliamente utilizados en criptografía como RSA . Se han utilizado muchas áreas de las matemáticas y la informática para resolver el problema, incluidas las curvas elípticas , la teoría algebraica de números y la computación cuántica .

En 2019, Fabrice Boudot, Pierrick Gaudry, Aurore Guillevic, Nadia Heninger, Emmanuel Thomé y Paul Zimmermann factorizaron un número de 240 dígitos (795 bits) ( RSA-240 ) utilizando aproximadamente 900 años centrales de potencia informática. Los investigadores estimaron que un módulo RSA de 1024 bits tardaría unas 500 veces más.

No todos los números de una longitud determinada son igualmente difíciles de factorizar. Los casos más difíciles de estos problemas (para las técnicas actualmente conocidas) son los semiprimos , el producto de dos números primos. Cuando ambos son grandes, por ejemplo, más de dos mil bits de longitud, elegidos aleatoriamente y aproximadamente del mismo tamaño (pero no demasiado cerca, por ejemplo, para evitar una factorización eficiente mediante el método de factorización de Fermat ), incluso los algoritmos de factorización prima más rápidos en el las computadoras más rápidas pueden tomar el tiempo suficiente para hacer que la búsqueda no sea práctica; es decir, a medida que aumenta el número de dígitos de los números primos factorizados, el número de operaciones necesarias para realizar la factorización en cualquier computadora aumenta drásticamente.

Muchos protocolos criptográficos se basan en la dificultad de factorizar números enteros compuestos grandes o un problema relacionado, por ejemplo, el problema RSA . Un algoritmo que factoriza eficientemente un entero arbitrario haría insegura la criptografía de clave pública basada en RSA .

Primera descomposición

Descomposición prima de n = 864 como

25 \times 3 3

Según el teorema fundamental de la aritmética , todo entero positivo tiene una factorización prima única . (Por convención, 1 es el producto vacío ). La prueba de si el número entero es primo se puede realizar en tiempo polinomial , por ejemplo, mediante la prueba de primalidad AKS . Sin embargo, si son compuestos, las pruebas de tiempo polinomial no dan una idea de cómo obtener los factores.

Dado un algoritmo general para la factorización de números enteros, cualquier número entero se puede factorizar en sus factores primos constituyentes mediante la aplicación repetida de este algoritmo. La situación es más complicada con los algoritmos de factorización de propósito especial, cuyos beneficios pueden no realizarse tan bien o incluso en absoluto con los factores producidos durante la descomposición. Por ejemplo, si n = 171 × p × q donde p < q son números primos muy grandes, la división de prueba producirá rápidamente los factores 3 y 19, pero tomará p divisiones para encontrar el siguiente factor. Como ejemplo contrastante, si n es el producto de los números primos 13729, 1372933 y 18848997161, donde 13729 × 1372933 = 18848997157 , el método de factorización de Fermat comenzará con lo que inmediatamente rinde y por lo tanto los factores a - b = 18848997157 y a + b = 18848997161 . Si bien estos se reconocen fácilmente como compuestos y primos respectivamente, el método de Fermat tomará mucho más tiempo para factorizar el número compuesto porque el valor inicial de para a no se acerca a 1372933. ${\ Displaystyle \ lceil {\ sqrt {n}} \ rceil = 18848997159}$ ${\ textstyle b = {\ sqrt {a ^ {2} -n}} = {\ sqrt {4}} = 2b}$ ${\ textstyle \ lceil {\ sqrt {18848997157}} \ rceil = 137292}$

Estado actual de la técnica

Entre los números de b bits, los más difíciles de factorizar en la práctica utilizando algoritmos existentes son aquellos que son productos de dos números primos de tamaño similar. Por este motivo, estos son los números enteros que se utilizan en las aplicaciones criptográficas. El semiprimo más grande hasta ahora factorizado fue RSA-250 , un número de 829 bits con 250 dígitos decimales, en febrero de 2020. El tiempo total de cálculo fue de aproximadamente 2700 años-núcleo de computación utilizando Intel Xeon Gold 6130 a 2,1 GHz. Como todos los registros de factorización recientes, esta factorización se completó con una implementación altamente optimizada del tamiz de campo numérico general ejecutado en cientos de máquinas.

Dificultad y complejidad

No se ha publicado ningún algoritmo que pueda factorizar todos los números enteros en el tiempo polinomial , es decir, que pueda factorizar un número n de b bits en el tiempo O ( b ^k ) para alguna constante k . No se ha demostrado ni la existencia ni la inexistencia de tales algoritmos, pero en general se sospecha que no existen y, por lo tanto, el problema no está en la clase P. El problema está claramente en la clase NP, pero generalmente se sospecha que no es NP-completo , aunque esto no ha sido probado.

Hay algoritmos publicados que son más rápidos que O ((1 + ε ) ^b ) para todos los ε positivos , es decir, sub-exponenciales . A partir del 2021-03-12, el algoritmo con el mejor tiempo de ejecución asintótico teórico es el tamiz de campo numérico general ( GNFS ), publicado por primera vez en 1993, que se ejecuta en un número n de b bits en el tiempo:

{\ Displaystyle \ exp \ left (\ left ({\ sqrt [{3}] {\ frac {64} {9}}} + o (1) \ right) (\ ln n) ^ {\ frac {1} {3}} (\ ln \ ln n) ^ {\ frac {2} {3}} \ derecha).}

Para las computadoras actuales, GNFS es el mejor algoritmo publicado para n grandes (más de unos 400 bits). Sin embargo, para una computadora cuántica , Peter Shor descubrió un algoritmo en 1994 que lo resuelve en tiempo polinomial. Esto tendrá implicaciones significativas para la criptografía si la computación cuántica se vuelve escalable. El algoritmo de Shor toma solo $O (b 3)$ tiempo y O ( b ) espacio en entradas de números de b bits. En 2001, se implementó por primera vez el algoritmo de Shor, utilizando técnicas de RMN en moléculas que proporcionan 7 qubits.

No se sabe exactamente qué clases de complejidad contienen la versión de decisión del problema de factorización de enteros (es decir: ¿ $n$ tiene un factor menor que $k$ ?). Se sabe que está tanto en NP como en co-NP , lo que significa que tanto las respuestas "sí" como las "no" se pueden verificar en tiempo polinomial. Una respuesta "sí" puede certificarse exhibiendo una factorización n = d ( n / d ) con d ≤ k . Una respuesta de "no" puede certificarse exhibiendo la factorización de n en distintos números primos, todos mayores que k ; uno puede verificar su primalidad usando la prueba de primalidad AKS , y luego multiplicarlos para obtener n . El teorema fundamental de la aritmética garantiza que solo hay una cadena posible de primos crecientes que serán aceptados, lo que demuestra que el problema está tanto en UP como en co-UP. Se sabe que está en BQP debido al algoritmo de Shor.

Se sospecha que el problema está fuera de las tres clases de complejidad P, NP-completo y co-NP-completo . Por lo tanto, es un candidato para la clase de complejidad intermedia NP . Si se pudiera demostrar que es NP-completo o co-NP-completo, esto implicaría NP = co-NP, un resultado muy sorprendente y, por lo tanto, se sospecha ampliamente que la factorización de enteros está fuera de estas dos clases. Mucha gente ha intentado encontrar algoritmos clásicos de tiempo polinomial para él y ha fallado, y por lo tanto, se sospecha ampliamente que está fuera de P.

En contraste, el problema de decisión "¿Es n un número compuesto?" (o de manera equivalente: "¿ n es un número primo?") parece ser mucho más fácil que el problema de especificar factores de n . El problema compuesto / primo se puede resolver en tiempo polinomial (en el número b de dígitos de n ) con la prueba de primalidad AKS . Además, existen varios algoritmos probabilísticos que pueden probar la primalidad muy rápidamente en la práctica si uno está dispuesto a aceptar una posibilidad de error extremadamente pequeña. La facilidad de las pruebas de primalidad es una parte crucial del algoritmo RSA , ya que es necesario encontrar números primos grandes para empezar.

Algoritmos de factorización

Proposito especial

El tiempo de ejecución de un algoritmo de factorización de propósito especial depende de las propiedades del número a factorizar o de uno de sus factores desconocidos: tamaño, forma especial, etc. Los parámetros que determinan el tiempo de ejecución varían entre algoritmos.

Una subclase importante de algoritmos de factorización de propósito especial son los algoritmos de Categoría 1 o Primera Categoría , cuyo tiempo de ejecución depende del tamaño del factor primo más pequeño. Dado un número entero de forma desconocida, estos métodos generalmente se aplican antes que los métodos de propósito general para eliminar factores pequeños. Por ejemplo, la división de prueba ingenua es un algoritmo de Categoría 1.

División de prueba
Factorización de ruedas
Algoritmo rho de Pollard
Algoritmos de factorización de grupos algebraicos , entre los que se encuentran el algoritmo p - 1 de Pollard , el algoritmo p + 1 de Williams y la factorización de la curva elíptica de Lenstra
Método de factorización de Fermat
Método de factorización de Euler
Tamiz de campo de número especial

Propósito general

Un algoritmo de factorización de propósito general, también conocido como algoritmo de categoría 2 , segunda categoría o familia de Kraitchik , tiene un tiempo de ejecución que depende únicamente del tamaño del número entero que se va a factorizar. Este es el tipo de algoritmo utilizado para factorizar números RSA . La mayoría de los algoritmos de factorización de propósito general se basan en el método de congruencia de cuadrados .

Otros algoritmos notables

Algoritmo de Shor , para computadoras cuánticas

Tiempo de ejecución heurístico

En teoría de números, hay muchos algoritmos de factorización de enteros que heurísticamente han esperado el tiempo de ejecución

{\ Displaystyle L_ {n} \ left [{\ tfrac {1} {2}}, 1 + o (1) \ right] = e ^ {(1 + o (1)) {\ sqrt {(\ log n ) (\ log \ log n)}}}}

en poco-O y L-notación . Algunos ejemplos de esos algoritmos son el método de curva elíptica y el tamiz cuadrático . Otro algoritmo de este tipo es el método de relaciones de grupo de clases propuesto por Schnorr, Seysen y Lenstra, que demostraron solo asumiendo la hipótesis de Riemann generalizada no probada (GRH) .

Tiempo de ejecución riguroso

Lenstra y Pomerance han probado rigurosamente que el algoritmo probabilístico de Schnorr-Seysen-Lenstra tenía un tiempo de ejecución esperado al reemplazar la suposición de GRH con el uso de multiplicadores. El algoritmo utiliza el grupo de clases de formas cuadráticas binarias positivas del discriminante Δ denotado por G _Δ . G _Δ es el conjunto de triples de enteros ( a , b , c ) en el que esos enteros son primos relativos. ${\ Displaystyle L_ {n} \ left [{\ tfrac {1} {2}}, 1 + o (1) \ right]}$

Algoritmo de Schnorr-Seysen-Lenstra

Dado un número entero n que se factorizará, donde n es un número entero positivo impar mayor que una determinada constante. En este algoritmo de factorización, el discriminante Δ se elige como un múltiplo de n , Δ = - dn , donde d es un multiplicador positivo. El algoritmo espera que para uno d existan suficientes formas suaves en G _Δ . Lenstra y Pomerance muestran que la elección de d puede restringirse a un conjunto pequeño para garantizar el resultado de suavidad.

Denote por P _Δ el conjunto de todos los primos q con el símbolo de Kronecker . Al construir un conjunto de generadores de G _Δ y formas primas f _q de G _Δ con q en P _Δ se produce una secuencia de relaciones entre el conjunto de generadores y f _q . El tamaño de q puede estar acotado por alguna constante . ${\ Displaystyle \ left ({\ tfrac {\ Delta} {q}} \ right) = 1}$ ${\ Displaystyle c_ {0} (\ log | \ Delta |) ^ {2}}$ ${\ Displaystyle c_ {0}}$

La relación que se utilizará es una relación entre el producto de potencias que es igual al elemento neutro de G _Δ . Estas relaciones se utilizarán para construir la denominada forma ambigua de G _Δ , que es un elemento de G _Δ de orden dividiendo 2. Calculando la factorización correspondiente de Δ y tomando un mcd , esta forma ambigua proporciona la factorización prima completa. de n . Este algoritmo tiene estos pasos principales:

Sea n el número a factorizar.

Sea Δ un número entero negativo con Δ = - dn , donde d es un multiplicador y Δ es el discriminante negativo de alguna forma cuadrática.
Tome las camisetas primeros números primos , por alguna . ${\ Displaystyle p_ {1} = 2, p_ {2} = 3, p_ {3} = 5, \ dots, p_ {t}}$ ${\ Displaystyle t \ in {\ mathbb {N}}}$
Sea una forma prima aleatoria de G _Δ con . ${\ Displaystyle f_ {q}}$ ${\ Displaystyle \ left ({\ tfrac {\ Delta} {q}} \ right) = 1}$
Encuentre un grupo electrógeno X de G _Δ
Recopile una secuencia de relaciones entre el conjunto X y { f _q : q ∈ P _Δ } satisfaciendo: ${\ Displaystyle \ left (\ prod _ {x \ in X _ {}} x ^ {r (x)} \ right). \ left (\ prod _ {q \ in P _ {\ Delta}} f_ {q} ^ {t (q)} \ right) = 1}$
Construya una forma ambigua que sea un elemento f ∈ G _Δ de orden dividiendo 2 para obtener una factorización coprima del divisor impar más grande de Δ en la que ${\ Displaystyle (a, b, c)}$ ${\ Displaystyle \ Delta = -4ac {\ text {o}} a (a-4c) {\ text {o}} (b-2a) (b + 2a)}$
Si la forma ambigua proporciona una factorización de n , deténgase; de lo contrario, busque otra forma ambigua hasta encontrar la factorización de n . Para evitar que se generen formas ambiguas inútiles, construya el grupo 2-Sylow Sll ₂ (Δ) de G (Δ).

Para obtener un algoritmo para factorizar cualquier entero positivo, es necesario agregar algunos pasos a este algoritmo, como la división de prueba y la prueba de suma de Jacobi .

Tiempo de ejecución esperado

El algoritmo como se indica es un algoritmo probabilístico ya que toma decisiones aleatorias. Su tiempo de ejecución esperado es como máximo . ${\ Displaystyle L_ {n} \ left [{\ tfrac {1} {2}}, 1 + o (1) \ right]}$

Ver también

Algoritmo de Bach para generar números aleatorios con sus factorizaciones
Representación canónica de un entero positivo
Factorización
Partición multiplicativa
Partición (teoría de números) : una forma de escribir un número como una suma de números enteros positivos.

Notas

Referencias

Richard Crandall y Carl Pomerance (2001). Números primos: una perspectiva computacional . Saltador. ISBN 0-387-94777-9.Capítulo 5: Algoritmos de factorización exponencial, págs. 191–226. Capítulo 6: Algoritmos de factorización subexponencial, págs. 227–284. Sección 7.4: Método de curva elíptica, págs. 301–313.
Donald Knuth . El arte de la programación informática , volumen 2: algoritmos seminuméricos , tercera edición. Addison-Wesley, 1997. ISBN 0-201-89684-2 . Sección 4.5.4: Factorizar en Primes, págs. 379–417.
Samuel S. Wagstaff Jr. (2013). La alegría de la factorización . Providence, RI: Sociedad Matemática Estadounidense. ISBN 978-1-4704-1048-3..
Warren Jr., Henry S. (2013). Hacker's Delight (2 ed.). Addison Wesley - Pearson Education, Inc. ISBN 978-0-321-84268-8.

enlaces externos

msieve - SIQS y NFS - ha ayudado a completar algunas de las factorizaciones públicas más grandes conocidas
Richard P. Brent, "Progreso reciente y perspectivas de los algoritmos de factorización de enteros", Computación y combinatoria " , 2000, págs. 3–22. Descargar
Manindra Agrawal , Neeraj Kayal, Nitin Saxena, "PRIMES está en P." Annals of Mathematics 160 (2): 781-793 (2004). Versión de agosto de 2005 PDF
Eric W. Weisstein, “RSA-640 factorizado” MathWorld Headline News , 8 de noviembre de 2005

Languages

In other projects