Javascript: Expresiones Regulares

Las expresiones regulares son una forma de describir cadenas de caracteres que sirven para comparaciones y reemplazos complejos. Por ejemplo si escribimos en la línea de comandos de windows dir *.exe, eso es una expresión regular que define todas las cadenas de caracteres que empiecen con cualquier cosa seguida de .exe, es decir, todos los archivos .exe. La acción de comparar la cadena de texto con el patrón que le hemos dado (la expresión regular) se denomina reconocimiento de patrones (pattern matching).

En Javascript las expresiones regulares se basan en las de Perl, de forma que son muy muy parecidas y se representan por el objeto RegExp (de REGular EXPresion). Para crear una expresión regular podemos usar el constructor del objeto RegExp, pero es mas conveniente utilizar una sintaxis especialmente pensado para ello. Veamos un ejemplo, el mas simple posible.

var patron = /pato/;

Este es el patrón mas sencillo. En una comparación con una cadena devolvería true en el caso de la cadena con la que se compara sea «pato». Todos los patrones se escriben entre barras invertidas, así como las cadenas de texto se escriben entrecomilladas. La otra forma de crear el objeto RegExp es como deciamos utilizando su constructor.

var patron = new RegExp(«pato»);

Pero en este caso lo que le pasamos al constructor es una cadena, por lo tanto en lugar de usar / lo entrecomillamos. Para complicar un poco mas las cosas supongamos que queremos comprobar si la cadena que nos pasan es pato, pata o pate. Entonces usariamos los corchetes, que indican opción, es decir, al comparar con /[aeo]/ devolvería cierto en caso de que la cadena fuera la letra a, la e o la letra o.

var patron = /pat[aeo]/;

¿Y si quisieramos comprobar si la cadena es pat0, pat1, pat2, …, pat9? En lugar de tener que encerra los 10 dígitos dentro de los corchetes podemos utilizar el guión, que sirve para indicar rangos. Por ejemplo 0-9 serían todos los números de 0 a 9 inclusive.

var patron = /pat[0-9]/;

Si quisieramos por ejemplo que el último caracter fuera o un dígito (0-9) o una letra minúscula (a-z) simplemente se escribirían dentro de los corchetes un criterio detras de otro.

//pat seguido de un número o letra minúscula
var patron = /pat[0-9a-z]/;
//ahora también puede estar seguido de una A mayúscula
var patron2 = /pat[0-9a-zA]/;

¿Y que ocurriría si en lugar de tener solo un número o una letra minúscula quisieramos que pudieran haber varias, pero siempre minúsculas o números? Entonces recurrimos a +, *, ? y {}. + indica que lo que tiene a su izquierda puede estar 1 o mas veces, * indica que puede estar 0 o mas veces (en el caso de + el número o la minúscula tendría que aparecer al menos una vez, con * pat también se aceptaría), ? indica opcionalidad, es decir, lo que tenemos a la izquierda puede o no aparecer (puede aparecer 0 o 1 veces) y por último {} sirve para indicar exactamente el número de veces o que puede aparecer o un rango. Por ejemplo {3} indicaría que tiene que aparecer exactamente 3 veces, {3,8} indicaría que tiene que aparecer de 3 a 8 veces y {3,} tres veces o mas (las que sean). Hay que tener cuidado porque {} exige que se repite lo último, cuando no se esté seguro de lo que va a hacer usamos (). Para ilustrar esto vamos a ver un primer ejemplo real con expresiones regulares:

<script>
var patron = /pat[ao]{2}/;
document.write(«patopata».search(patron));
document.write(«patoa».search(patron));
patron = /(pat[ao]){2}/;
document.write(«patopata».search(patron));
document.write(«patoa».search(patron));
</script>

La función search del tipo de objeto de String (asociado a las cadenas de caracteres) comprueba si la cadena representada por el patrón que le pasamos como argumento se encuentra dentro de la cadena sobre la que se llama a search. En el caso de que así sea devuelve la posición (por ejemplo para la cadena pato con el patron /p/ devolvería 0, 1 si el patrón es a, 2 si es t,…) y -1 si no se encuentra. Otra función útil que merece la pena comentar es cadena.replace(patron, sustituto), que sustituye en la cadena sobre la que se llamó las ocurrencias del patrón por la cadena especificada

Si ejecutamos el programa anterior la salida por pantalla será -100-1, es decir, la primera y última llamada a search devuelven no encontrado y la segunda y las otras dos encuentran la cadena en la posición 0. Si nos fijamos vemos que esto es obvio. El patrón que definimos primero, /pat[ao]{2}/ incluye las cadenas «pataa», «patao», «patoo» y «patoa», ya que lo que indica {2} que debe repetirse dos veces es [ao], no pat[ao]. Sin embargo cuando redefinimos el valor del patron utilizamos los paréntesis de forma que {2} se aplique sobre pat[ao].

Otro elemento interesante en las expresiones regulares es la especificación de las posiciones en que se tiene que encontrar la cadena, esa es la utilidad de ^ y $, que indican que el elemento sobre el que actúa debe ir al principio de la cadena o al final de esta.

//buscamos «oo» y que se encuentre al principio de la cadena en la que esté
var patron = /^aa/;
//buscamos uu al final de la cadena
patron = /uu$/;

Otros elementos a tener en cuenta son:

  • \d un dígito. Equivale a [0-9]
  • \D cualquier caracter que no sea un dígito.
  • \w Cualquier caracter alfanumérico. Equivalente a [a-zA-Z0-9_].
  • \W cualquier caracter no alfanumérico
  • \s espacio
  • \t tabulador

88 pensamientos en “Javascript: Expresiones Regulares”

  1. Hola, podrías decirme que significa esta expresión regular?

    /\W/i

    Tengo duda con la «i» del final.

    De antemano muchas gracias.

  2. Alguien me podría decir porqué sólo me funciona una de las dos y no las dos juntas.

    formato = sel.text;
    formato = formato.replace(/\[b-p\]/,»[–p]»);
    formato = formato.replace(/\[\/(«b-p»)\]/,»[/–p]»);

    1. no, porque al final /[0-9]{1,3}-{1}[0-9]/

      esta parte –> [0-9]

      solo indicas que es uno solo, si pones:

      [0-9]+ ahi si, porque el mas significa que desde uno a infinito

  3. Hola, he estado mirando una exprecion para validar mail, pero no he encontrado una que funcione bien y si funciona no la entiendo, me pordian ayudar a entender esta: ^(.+\@.+\..+)$

    Gracias

  4. Aquí hay una expresión regular para email más entendible.

    [_a-z0-9-]+(.[_a-z0-9-]+)*@([0-9a-z](-?[0-9a-z])*.)+[a-z]{2}([zmuvtg]|fo|me)?

  5. No se porque no valida la longitud máxima en esta expresion : /\d{2,4}/ esto deberia validar cadenas de numeros entre 2 y 4 digitos pero el 12345 lo da como bueno.

    1. No indicas que tiene que morir la expresion, es decir, le dices que inicio con 4 numeros y 5numeros obviamente inician con los 4 primeros :
      pasa de : /\d{2,4}/ a /^\d{2,4}$/

  6. Esta es una respuesta para Luis Fernando sobre la siguiente expresion regular «^(.+\@.+\..+)$», en primer lugar debemos indicar que los caracteres «^» y «$» indican el inicio y fin del patrón, luego tenemos el «.» que es el metacaracter (caracter para referirnos a otros caracteres) que sirve para identificar cualquier caracter seguido de «+» que sirve para indicar que se repite 1 o más veces, luego tenemos «\@» con lo que estamos indicando que el «@» debe estar, luego tenemos «\.» con lo que se indica que el «.» debe estar y por último tenemos nuevamente el «.+» que como comenté significa cualquier caracter 1 o más veces.
    De igual manera esa expresión tiene un error y es que por ejemplo permite cosas como esta:
    micorreo@@correo.com

  7. Hola necesito hacer una expresion regular que valide que solo sea texto y no permita caracteres especiales, no he podido hacerla.

    PD:y he probado alguno ejemplos y alguno no me funcionan y otros si, esto de que depende?????

    Por favor ayudenme…..

  8. Liosdany: Solo valida texto,,,cadenas
    —————
    var ExpReg_cad=/^[aA-zZ]*$/;
    if (ExpReg_cad.test(campo.value)==false && campo.value.length>0 ){
    alert(messageError(‘Sólo puede ingresar letras’));
    campo.value=»»;
    return false;
    }

    —————————–
    valida texto, numero y espacios

    var ExpReg_aln= /^[\s-\w]*$/;
    if (ExpReg_aln.test(campo.value)==false && campo.value.length>0 ){
    alert(messageError(‘Sólo puede ingresar letras, numeros y espacios’));
    campo.value=»»;
    return false;
    }

  9. Pingback: Ayuda con validacion de datos - Foros del Web

  10. Luis Fernando prueba con este patron para email:

    Ej:
    var patronEmail=/(^[0-9a-zA-Z]+(?:[._][0-9a-zA-Z]+)*)@([0-9a-zA-Z]+(?:[._-][0-9a-zA-Z]+)*\.[0-9a-zA-Z]{2,3})$/;

    if (!patronEmail.test(email a validar))
    alert(«Email incorrecto»);

  11. Como se puede hacer un patron que verifique un Rut(Chileno). Sin tomar en cuenta la validacion matematica.

    Los rut tienen la siguien forma:
    XY.YYY.YYY-Z

    La X es Opcional [0-9].
    Las Y son necesarias [0-9].
    La Z es necesaria [1-9k].(la k puede ser mayuscula o minuscula.

    se me ocurrio algo como:
    /^([0-9]{1,2}(\.|»)[0-9]{3}(\.|»)[0-9]{3}(-|)[1-9|k|K]/$

    pero no resulta xD
    la verdad es que lo hice con lo que he entendido en foros y cosas por el estilo

    1. Adjunto la función completa.
      Solo valida el formato y retorna el rut formateado.

      function formato_rut(rut){
      var sRut1 = trim(rut.value);
      var tmpstr=»»;
      for ( i=0; i = 0; i– ) {
      sInvertido += sRut1.charAt(i);
      if (i == sRut1.length – 1 )
      sInvertido += «-«;
      else if (nPos == 3) {
      sInvertido += «.»;
      nPos = 0; }
      nPos++; }
      for(var j = sInvertido.length – 1; j >= 0; j– ) {
      if (sInvertido.charAt(sInvertido.length – 1) != «.»)
      sRut += sInvertido.charAt(j);
      else if (j != sInvertido.length – 1 )
      sRut += sInvertido.charAt(j);
      }
      rut.value = sRut.toUpperCase();
      }

  12. Hola necesito saber que como validar dos numeros 49 y 28 ya valido para uno solo en esta expresion regular
    [RegexValidator(@»^49(\d{5}?)», Ruleset = «STCCRules»,
    MessageTemplateResourceName = «ErrorLenWar»,
    MessageTemplateResourceType = typeof(ErrorMessages))]
    cualquier ayuda se los agrecere mucho.
    saludos

  13. Aca hay una validacion de mail que me funciono, este es el patron («^([0-9a-zA-Z]([_.w]*[0-9a-zA-Z])*@([0-9a-zA-Z][-w]*[0-9a-zA-Z].)+([a-zA-Z]{2,9}.)+[a-zA-Z]{2,3})$»);

  14. Esta pagina esta muy interesante, y el contenido me parece excelente, creo que me sera de mucha utilidad en el futuro proximo..

  15. Hola,
    A ver si alguien me puede ayudar. Necesito una expresión regular para validar un combo (lista desplegable). Por defecto la lista sale con el valor «–selecciona opción–«. Y necesito comprobar mediante una expresión regular cuando el usuario ha seleccionado una opción del combo QUE NO SEA la inicial de «–selecciona opción–«. Es decir, necesitaría una expresión que me dijera… true si la cadena/valor seleccionado no contiene el guión (-), por ejemplo.
    ¿A alguien se le ocurre alguna solución?
    ¡Gracias!

  16. javi seria mas facil validar de otra forma tu lista desplegable ya sea que a «–selecciona opción–» le pongas el –selecciona opción– y en el evento «onChange» valides si es = a 0 entonces sabes que seleccionaron «–selecciona opción–» espero que te sirva esto y me haya explicado correctamente

  17. una expresion regular que te permita detectar en una cadena ingresada por un lector de codigo de barras los caracteres de control CR LF que son (13) y (10)respectivamente, valor ascii

  18. El problema que tengo con las expresiones regulares es que no puedo controlarlo para que haga 1 solo –
    intente colocandolo asi \-{1} para poder hacer solo 1 – pero acepta 1 o mas …
    Gracias

  19. hola interesante la pagina, me podrian ayudar indicandome como hago unas expresion regulares que acepten solo numero decimales con tres digitos , cantidad en millones. les agradeceria mucho

  20. a Javi:

    if(document.formulario.combo1.selectedIndex)==0{
    alert(«Selecciona una opcion»);
    }

    donde ‘formulario’ es el nombre de tu form y ‘combo1’ es el nombre de tu caja desplegable

    en pocas palabra dice: si el indice seleccionado del combo1, del formulario de tu documento es el 0 (el primer elemento) entonces aparecera una alerta que dice ‘Selecciona una opcion’

  21. para el rut utilize este patron
    /^\d{1,9}[-][1-9|k|K]$/
    el cual me aceptará nnnnnnnnn-c
    (acepta 9 digitos porque hay algunas empresas que ya estan en los 100 millones)

  22. Hola, he estado viendo esto de las expresiones regulares y la dura que ya me duele la test con esto. mis dudas y problemas con varios al respecto, pero creo que con esta me basta por ahora…

    tengo entendio que la expresion \w\ me permite olocar cualquier carater alfanumerico incluido el guion bajo, ahora mi pregunta es, donde diblos veo cuales son los caracteres alfanumericos y cuales no, pq hasta donde yo se el signo igual, el prentecis, la barr diagonal y otros no son alfanumericos y aparecen igual…

    gracias y espero no aburrirlos…

  23. Hola necesito seguir el siguiente patron

    $Letra=>»x,y,z»

    patron=$letra-8digitos-1digito
    Si alguien podria echarme una mano con esto la idea es que lo haga con onKeyup y no con un boton submit.

  24. yo de nuevo :
    parece que la pagina no acepta codigo html.
    pero bueno en todo caso si quieren todo mi sistema que estoy elaborando no mas dence una vueltita por mi blog, y en la obcion de php estan mis clases. tambien lo colgare mi proyecto

  25. Hola a todos:
    Tengo un programa que extrae datos de una b.d. mysql, los muestro y pongo una caja de texto y tengo que teclear solamente uno de los numero que despliego.
    Por ejemplo: el primer renglon es
    8 16 24 32 40 aqui pongo la caja de texto para teclear uno de esos 5 valores, solamente debo de teclear 8,16,24,32 o 40
    Siempre son 5 numeros pero son n renglores los que muestro dependiendo de la opcion seleccionada y cada renglon trae valores diferentes

    ¿Como puedo validar esto?
    ¿Alguien me puede ayudar?

    El sistema lo estoy programando en php y ajax

  26. Anexo el codigo de como muestro la informacion, aqui solo estoy validando que sean numeros los que se tecleen, pero no es realmente eso lo que necesito, lo que requiero es que se tecleen unicamente los valores como lo mencione anteriormente 8 16 24 32 40

    Este es el codigo
    for ($j=1;$j<=$numregc;$j++){
    $registroc=mysql_fetch_row($resultbusqc);
    echo "
    $registroc[2]
    $registroc[3]
    $registroc[4]

    $registroc[5]
    $registroc[6]
    $registroc[7]
    $registroc[8]
    <input type='text' size=2 name='total$tregis' id='total$tregis' onkeypress='if (event.keyC
    ode 57) event.returnValue = false;’ />»;
    }
    }

  27. Buen dia necesito por favor ayuda para validar numeros decimales y tipo moneda por ejemplo 1.250,58 he visto laas validaciones anteriores pero no hay una q contemple este formato…

  28. Muy buen aporte, recién comienzo con las expresiones regulares y está perfecto aunque tengo un problema, quiero saber cuál sería la expresión regular para validar solo letras y algun espacio, pero evitar caracteres especiales y números.
    Intenté con esto:
    ^/\s/A-Za-z$

    Gracias
    saludos 🙂

  29. Hola buenas a todos.

    Mi duda es:

    En una caja de texto tengo que introducir una cadena pero solamente acepta guiones bajos y medios, en medio de la cadena no puede aceptar guiones de cualquier tipo al final ni al principio .

    Se pueden repetir 2 guiones de diferente tipo pero no se pueden poner 2 veces guiones del mismo tipo.

    Muestro algunos ejemplos de como deberia de ir:

    NO Puede aceptar dos guiones del mismo tipo seguidos

    Ejemplo Hola__Adiós
    Hola–Adiós

    SI puede Aceptar dos o mas guiones seguidos pero de diferente tipo.

    Ejemplo Hola-_-_-_-_-Adiós
    Hola_-_-_-_-_Adiós

    SI puede aceptar un guión de un solo tipo.

    Ejemplo Hola-Adiós-hola-adios-hola_adios_hola

    Espero me puedan ayudar ya que es un pokito urgente y si no de ante mano muchas GRACIAS!

    Saludos….

  30. Buenos dias, saben he estado queriendo validar lo siguiente:

    1,2,3-5 –>que solo me permita la , y el – y los demas q sean solo numeros, alguien podria ayudarme?

  31. Hola:
    ¿Cómo puedo obtener el valor númerico de una expresion regular que contiene una cadena de caracteres? Por ejemplo:

    A+B/C

    Donde los valores de A,B y C los entra el usuario por textBox.

    ¿Alguien podría ayudarme?

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.