Source code for synapse.lib.stormlib.mime

import bs4

import synapse.lib.coro as s_coro
import synapse.lib.stormtypes as s_stormtypes


[docs]
def htmlToText(html):
    soup = bs4.BeautifulSoup(html, 'html5lib')
    return soup.get_text(separator='\n', strip=True)



[docs]
@s_stormtypes.registry.registerLib
class LibMimeHtml(s_stormtypes.Lib):
    '''
    A Storm library for manipulating HTML text.
    '''
    _storm_locals = (
        {'name': 'totext', 'desc': 'Return inner text from all tags within an HTML document.',
         'type': {'type': 'function', '_funcname': 'totext',
                  'args': (
                      {'name': 'html', 'type': 'str', 'desc': 'The HTML text to be parsed.'},
                  ),
                  'returns': {'type': 'str', 'desc': 'The newline-joined inner HTML text.', }
        }},
    )

    _storm_lib_path = ('mime', 'html')


[docs]
    def getObjLocals(self):
        return {
            'totext': self.totext,
        }



[docs]
    @s_stormtypes.stormfunc(readonly=True)
    async def totext(self, html):
        html = await s_stormtypes.tostr(html)
        return await s_coro.semafork(htmlToText, html)