it-swarm.it

Rimuovi HTML dalla stringa Ruby on Rails

Sto lavorando con Ruby su Rails, c'è un modo per rimuovere html da una stringa usando il metodo sanitize o uguale e mantenere solo il testo all'interno dell'attributo value sul tag input?

109
Mattias

C'è un strip_tags metodo in ActionView::Helpers::SanitizeHelper:

http://api.rubyonrails.org/classes/ActionView/Helpers/SanitizeHelper.html#method-i-strip_tags

Modifica: per ottenere il testo all'interno dell'attributo value, potresti usare qualcosa come Nokogiri con un'espressione Xpath per estrarlo dalla stringa.

132
Michael Kohl

Se vogliamo usarlo nel modello

ActionView::Base.full_sanitizer.sanitize(html_string)

che è il codice nel metodo "strip_tags"

169
Jon

Sì, chiama questo: sanitize(html_string, tags:[])

21
bcackerman
ActionView::Base.full_sanitizer.sanitize(html_string)

La lista bianca di tag e attributi può essere specificata come qui sotto

ActionView::Base.full_sanitizer.sanitize(html_string, :tags => %w(img br p), :attributes => %w(src style))

L'istruzione precedente consente i tag img, br e p e attributi src e style.

17

Ho usato la libreria Loofah, poiché è adatta sia per HTML che per XML (sia documenti che frammenti di stringhe). È il motore dietro la gemma disinfettante html. Sto semplicemente incollando l'esempio di codice per mostrare quanto sia semplice da usare.

Gemma di luffa

unsafe_html = "ohai! <div>div is safe</div> <script>but script is not</script>"

doc = Loofah.fragment(unsafe_html).scrub!(:strip)
doc.to_s    # => "ohai! <div>div is safe</div> "
doc.text    # => "ohai! div is safe "
5
Krishna Vedula

Cosa ne pensi di questo?

white_list_sanitizer = Rails::Html::WhiteListSanitizer.new
WHITELIST = ['p','b','h1','h2','h3','h4','h5','h6','li','ul','ol','small','i','u']


[Your, Models, Here].each do |klass| 
  klass.all.each do |ob| 
    klass.attribute_names.each do |attrs|
      if ob.send(attrs).is_a? String
        ob.send("#{attrs}=", white_list_sanitizer.sanitize(ob.send(attrs), tags: WHITELIST, attributes: %w(id style)).gsub(/<p>\s*<\/p>\r\n/im, ''))
        ob.save
      end
    end
  end
end
1
josetapadas