Utilidades con String de OpenCms
De OpenCmsWiki
CmsHtmlConverterJTidy
Limpiador de código HTML usando la librería JTidy.
Ejemplo: Limpiar el código excerpt que genera lucene en el buscador.
<c:forEach var="item" items="${result}">
<div class="search_result">
<a href="<cms:link>${item.path}</cms:link>"><strong><c:out value="${item.title}"/> (<c:out value="${item.score}"/>%)</strong></a>
<c:set var="excerpt">${item.excerpt }</c:set>
<%
String excerpt = ""+pageContext.getAttribute("excerpt");
CmsHtmlConverterJTidy jtidy = new CmsHtmlConverterJTidy();
excerpt = jtidy.convertToString(excerpt);
%>
<div class="search_result_description"><%=excerpt %></div>
<small><fmt:formatDate value="${item.dateLastModified}" type="both"/></small>
</div>
</c:forEach>
CmsHtmlExtractor
Extrae el texto de plano de un texto con etiquetas HTML.
Ejemplo: En un buscador, a la hora de pasar la query a lucene extraer el parámetro recibido para evitar que se haga un mal uso del buscador. Además nos permite para parsear el encoding que nos interesa.
String query = request.getParameter("query");
if(query!=null)
{
query = CmsHtmlExtractor.extractText(query, cmsObj.getRequestContext().getEncoding());
search.setQuery(new String(query.getBytes(),cmsObj.getRequestContext().getEncoding()));
}