top of page

Treinamento em Química Computacional - LECiC/GIEESAA

Introdução

Este treinamento destina-se, fundamentalmente, aos alunos que estejam realizando seu primeiro trabalho teórico no Laboratório de Estudos em Ciências da Conservação (LECiC) e/ou no Grupo Interdisciplinar de Educação Saúde Eletroquímica Ambiente e Arte (GIEESAA). A ideia aqui não é de formar químicos teóricos, mas usuários autônomos que utilizem a modelagem molecular como uma ferramenta para resolver problemas relacionados à química que é investigada no LECiC e no GIEESAA. O treinamento em si está dividido em 8 etapas

  • Etapa 0 - Atualização bibliográfica em fontes confiáveis.

  • Etapa 1- A química computacional

  • Etapa 2 - Introdução ao Linux

  • Etapa 3 - Aspectos gerais da submissão dos cálculos

  • Etapa 4 - Aspectos operacionais dos softwares utilizados:

    • 5.1. Avogadro

    • 5.2. Mercury

    • 5.3 MacMolplt

    • 5.4. Gamess

    • 5.5. Gaussian

    • 5.6. Quantum espresso

  • Etapa 5 - Redação científica

  • Etapa 6 - Apresentação de trabalhos

  • Etapa 7 - Trabalho final tutoriado

À medida que o estudante estiver avançando no treinamento, os conhecimentos da etapa posterior deverão ser utilizados na etapa subsequente.

Alguns dos programas usados possuem suas versões para sistemas Windows e MacOS, mas, neste treinamento, nós sempre usaremos  como referência sistemas Ubuntu/Linux, disponíveis em ambos os laboratórios.

É importante que o estudante que esteja empenhado em absorver conhecimentos em química computacional seja diligente e esteja pronto para buscar por si só informações em outros tutoriais e referências para além deste treinamento.

ETAPA 0 - Atualização bibliográfica em fontes confiáveis

Grosso modo, no âmbito das ciências naturais, todo trabalho acadêmico relevante (geralmente provenientes dos projetos de IC/IT, mestrado e doutorado) é tornado público na forma de um artigo científico.

Afora a questão do idioma e linguajar, usualmente redigidos em um inglês mais técnico, uma das grandes diferenças dos artigos científicos é o processo de revisão por pares (peer-review). De fato, o processo de revisão desses documentos faz com que eles gozem de grande confiabilidade entre a comunidade científica e que, possam ser utilizados como base para novas descobertas. O processo de peer-review é esquematizado na figura abaixo.

PLOS_ONE_article_process_chart_7.jpg

O processo de revisão por pares pode ser melhor compreendido acessando o link da revista PLOS ONE. A ideia da revisão por pares é eliminar, ao máximo, as inconsistências que possam ser geradas durante os trabalhos realizados nos mais diversos laboratórios. É importante lembrar, entretanto, que um artigo científico não é a fonte da verdade absoluta. Ele pode refletir a verdade de um determinado momento e que reflete as limitações analíticas e de compreensão de um momento histórico específico.

Por toda essa especificidade, os periódicos que publicam artigos científicos podem ter caráter geral ou ser especializados em determinados assuntos. O grupo Nature, por exemplo tem uma revista geral e outras várias especializadas: Nature Astronomy, Nature Geoscience, Nature Physics, etc. Como a revista geral congrega as mais relevantes contribuições de cada área, é natural que ela seja mais lida e citada do que as revistas especializadas. Um índice que mede esse 'impacto' de uma revista na comunidade científica é o fator de impacto. Clique aqui para ver ranking dos fatores de impacto dos principais periódicos.

Por todo acima exposto, as melhores referências serão encontradas justamente nos periódicos de grande circulação e com fatores de impacto mais altos. Isso não é por si só uma regra, mas é claramente esperado. Pode ser difícil encontrar esses periódicos espalhados por toda internet e, por isso, o uso de motores de busca geral como o Google, Yahoo, etc. acaba não sendo uma ideia tão excelente assim.

 

A procura de artigos científicos é sempre melhor feita em bases de dados especializadas. Embora haja uma nova tendência de artigos de acesso aberto, a maior parte dos artigos científicos é pago para o público em geral. Felizmente, o governo brasileiro é assinante de vários desses periódicos/base de dados e permite o acesso à informação através do 'periódicos capes' e também a partir de qualquer computador que acesse a internet de universidades e institutos de pesquisas. É possível buscar artigos científicos, com confiança, nas seguintes bases de dados:

ScienceDirect.jpg
wos.gif
scifinder_logo.gif
índice.jpg
CAPES.png

Livros, trabalhos de conclusão de curso, dissertações e teses até podem ser usados como referências, mas é sempre melhor verificar as listas de referências desses trabalhos para ter acesso às fontes originais. Desta forma, tem-se maior certeza da veracidade e precisão da informação. 

Os motores de busca funcionam todos mais ou menos da mesma forma e o uso dos operadores booleanos e a sistematização de palavras-chave e filtros de restrição garantirão que você encontre muita informação e que esteja atualizado em relação à bibliografia da sua área de pesquisa. 

ETAPA 1 - A química computacional

Embora stricto sensu química teórica e química computacional não sejam sinônimos, nos dias atuais é comum que esses termos sejam usados em equivalência. Desta forma, segundo o Gold Book da IUPAC: 

 

Química ​computacional é a disciplina que utiliza métodos matemáticos para o cálculo de propriedades moleculares ou para a simulação do comportamento molecular. 

Grosso modo, e em termos práticos, a química computacional pode ser compreendida como o ramo da química que faz uso das equações de diferentes métodos teóricos, implementadas em softwares para o cálculo de propriedade atômicas, iônicas, moleculares e radicalares.  

Captura_de_Tela_2020-08-26_às_19.13.06

Por todo acima exposto, não é difícil compreender que a química computacional emerge como uma área multidisciplinar na qual são admitidos pesquisadores de diversas outras áreas, desde médicos, que estudam o comportamento de uma determinada proteína à conservadores-restauradores que estudam novas possibilidades de preservação de esculturas. Em um nível mais profundo, a química computacional também é capaz de envolver desde físicos, que desenvolvem novas equações e métodos teóricos até cientistas da computação, que implementam essas equações em um ambiente favorável a um usuário final. Por toda cooperação e pluralidade, a química computacional é uma das áreas que mais cresce e contribui no desenvolvimento científico atual. Em um aspecto amplo, a química teórica, a química computacional e a modelagem molecular são termos equivalentes no jargão científico

leach.jpg

As seções abaixo tratarão de alguns aspectos fundamentais da química computacional. Evidentemente, esse programa de treinamento intenta apenas em ser a primeira leitura a respeito do assunto, que não se esgota nessas poucas palavras.  Como segunda leitura, recomenda-se alguns livros, que podem ser (inclusive) encontrados no sistema de bibliotecas da UFRJ. O "Leach" é um livro bastante completo, mas pode soar complexo aos neófitos no assunto. O "Hinchliffe" tem uma leitura um pouco menos árida e a divisão de conteúdos é bem interessante.

 - Leach, A. “Molecular Modelling: Principles and Applications”, 2nd Edition, Prentice Hall, 2001.

 - Hinchliffe, A. Molecular Modelling for Beginners, 1st Edition, John Wiley & Sons, 2003

O Leach e o Hinchiliffe são livros clássicos de modelagem molecular. Entretanto também há bons livros de modelagem molecular em português, um exemplo é o livro da Prof. Nelson e da Profa. Kaline:

 - Morgon, NH.; Coutinho, K. Métodos de Química Teórica e Modelagem Molecular. Editora Livraria da Física,2007

É comum que dissertações e teses na área de química teórica possuam um capítulo (ou ao menos uma seção) em que o autor discute a "Fundamentação teórica" ou "metodologia teórica" empregada naquele trabalho. É sempre muito útil ler esses trabalhos, mas deve-se ter a ressalva que esses documentos estarão direcionados ao tema daquele trabalho, em específico. Em suma, este tipo de escolha deve ser feito com parcimônia.

 - Os diferentes métodos teóricos 

Para que se obtenha resultados úteis e confiáveis, a escolha do método teórico de simulação é uma das etapas-chave do processo de modelagem molecular. Entretanto, a adequação de um determinado método teórico em relação a outros, fundamentalmente, diz respeito a três pontos

  • Tamanho do sistema a ser calculado: pode variar de alguns poucos à milhões de átomos

  • Nível de teoria a ser adotado: pode variar desde uma simulação cheia de aproximações até outras que levam em consideração aspectos relativísticos do sistema.

  • Capacidade computacional disponível: pode variar desde celulares modernos até cluster de computadores, como o Santos Dumont - instalado no Laboratório Nacional de Computação Científica (LNCC).

 Superficialmente, os métodos teóricos usados nos trabalhos do LECiC/GIEESAA podem ser divididos em dois grandes grupos:

Captura_de_Tela_2020-08-27_às_09.48.47

Cálculos Clássicos: Mecânica Molecular

Com um custo computacional relativamente baixo, a mecânica molecular pode ser grosseiramente resumida como um método teórico clássico, i.e. baseado na física newtoniana que simula o sistema a partir átomos (com massas diferentes) que são unidos por molas (com constantes elásticas distintas).

Esse conceito é atualmente usado para simular o comportamento de sistemas relativamente grandes (e.g. proteínas) em função do tempo, i.e. para estudar o comportamento molecular, em uma técnica chamada de Dinâmica molecular.

A depender dos campos de força usados, os cálculos de mecânica molecular são úteis para realizar a predição da geometria molecular (ainda que pouco acurada) de moléculas pequenas.

Não obstante a mecânica molecular seja um método teórico que descreve bem a geometria molecular, os resultados não tem nenhuma correlação com os elétrons do sistema estudado. Por si só isso é um problema, uma vez que a maior parte da química depende, justamente,  da interação entre os elétrons.

Cálculos Quânticos: Teoria do Funcional de densidade (DFT).

A descrição da estrutura eletrônica é algo tão importante que desde o ensino médio, os estudantes aprendem a fazê-la em sistemas atômicos pelo princípio de Aufbau.  Na graduação, os estudantes que fazem algum curso de química geral  aprofundam-se e aprendem a descrever a estrutura eletrônica de sistemas moleculares simples (O2, H2O, CH4, etc..) através da Teoria do Orbital Molecular e da Teoria da Ligação de Valência. Para sistemas maiores (e.g. uma molécula de ácido acetil salicílico) a descrição da estrutura eletrônica é melhor feita à partir de conceitos estruturados no modelo atômico de Schrödinger, i.e. a partir de uma abordagem feita na mecânica quântica.

Um dos métodos iniciais para descrever as funções de onda e a energia é o método Hartree-Fock (HF). O método HF tem grande contribuição na área de química computacional e derivou outros igualmente importantes: O primeiro grupo diz respeito aos métodos semi-empíricos, nos quais parâmetros experimentais foram adicionados às equações na intenção de reduzir o custo computacional. O segundo grupo de métodos são chamados de ab initio (ou cálculos de primeiros príncípios) e tentam resolver o problema da correlação eletrônica. Os métodos HF e pHF são, superficialmente, tratados nos vídeos ao lado.

Um dos desafios associados aos cálculos quanto-mecânicos, diz respeito à forma com que os elétrons serão representados. Observe que essa é uma questão central para a correta descrição da estrutura eletrônica de qualquer sistema. Nos primórdios da química computacional a estrutura eletrônica era representada a partir dos chamados orbitais de slater (STO, Slater-Type Orbitals), mas por questões diversas - sobretudo relacionada à acurácia em sistemas maiores, eles caíram em desuso, ou melhor, passaram a ser chamadas de base mínima.

Modernamente há dois tipos principais de bases: As bases de Pople (e.g. 6-31G) e as bases de Dunning (e.g. cc-pVDZ).

A DFT.

 

A DFT é uma técnica computacional que acaba se mantendo no "limbo" entre um método semi-empírico e um cálculo de primeiros princípios. Desta forma, embora químicos teóricos puristas tenham convincentes motivos para classificá-la com um método semi-empírico, não é difícil encontrar na literatura fartos exemplos que classificam a DFT como um método ab initio. Atualmente, a DFT é usada para estudar a estrutura eletrônica de átomos, moléculas, íons e radicais - isolados ou em estado sólido. Inquestionavelmente a DFT é um dos métodos teóricos mais populares e versáteis disponíveis na área da modelagem molecular.

Jacobs-ladder-for-the-five-generation-of

A ideia central da DFT nasceu de Hohenberg e Kohn (1964), ao demonstrarem que é possível extrair uma série de propriedades (e.g. energia total) de um determinado sistema, a partir da densidade eletrônica do seu estado fundamental. Grosso modo isso significa que, ao encontrar o estado de menor energia de um sistema é possível calcular sua estrutura eletrônica e a partir dela extrair as propriedades desejadas. Uma questão importante acontece quando nas minúcias da teoria, um dos termos  da energia total, o potencial de troca-correlação (XC), não consegue receber solução analítica, i.e. por razões diversas não é possível calcular essa contribuição de maneira direta. Desta forma, nos cálculos feitos por DFT é sempre necessário escolher um funcional que "representará" esse termo na equação da energia total. Há várias propostas para esses funcionais que os químicos teóricos os classificam em famílias: LDA, GGA, MetaGGA, etc.

ETAPA 2 - Introdução ao Linux

51nhbvCpVaL._AC_SL1000_.jpg

Inquestionavelmente, a maior parte dos computadores do planeta utilizam o Microsoft Windows como sistema operacional. De fato, sistemas Windows apresentam uma série de vantagens - sobretudo para os usuários menos avançados. Entretanto em termos de computação científica os sistemas Linux são sempre predominantes, sobretudo por apresentarem uma série de benefícios e.g. melhor gerenciamento de memória, possibilidade de operação sem interface gráfica, maior estabilidade além do custo zero de licenciamento. Há uma série de distribuições Linux, dentre as quais (talvez) a mais popular seja o Ubuntu. O Ubuntu é uma "distro" direcionada para usuários finais, possui interface gráfica com o modus operandi semelhante ao do Windows (clicar, arrastar, etc...).

Entretanto, ao operar um cluster de servidores a partir de um computador doméstico, você terá que trabalhar com o terminal, que é uma interface na qual o usuário dá comandos aos computadores, sem interface gráfica.

Enquanto a operação for feita em uma máquina com interface gráfica, o terminal não será praticamente utilizado, entretanto, os softwares de cálculo recebem instruções (quase sempre) através de linhas de comando no terminal. Adicionalmente, o pequeno cluster do LECiC/GIEESAA não possui interface gráfica, i.e. toda operação deverá ser feita por linhas de comando.

ubuntulogo_3.png

No caso específico do Ubuntu, o terminal de comando pode ser acessado através do atalho:

Control + Alt + T

ETAPA 3 - Aspectos gerais da submissão de cálculos

Em uma etapa anterior à própria submissão dos cálculos, é necessário compreender o como funciona um sistema de computação científica. Fundamentalmente, há pelo menos três "tipos" de computadores que são comumente utilizados como máquinas de cálculo: computadores domésticos, servidores e clusters de servidores Entretanto, para alguns softwares, especificamente, também é possível realizar cálculos em placas de vídeo (GPUs), ou melhor, usando os processadores instalados em placas de vídeo (cuda core), com ganhos significativos de performance.

Computadores domésticos (PC)

Os computadores domésticos são máquinas projetadas para o uso cotidiano e que, geralmente, exigem tarefas mais simples. Esses PCs, quando usados para cálculos científicos, são geralmente torres com alto poder de processamento e quantidades massivas de memória RAM, dependendo do cálculo que vai ser executados neles.  A principal vantagem de realizar cálculos de modelagem molecular em computadores doméstico é o custo associado a esses equipamentos. Atualmente os processadores da Intel que equipam os computadores pessoais são: i3, i5, i7 e i9 que podem ter até 20 threads rodando ao mesmo tempo.

Servidores.

Os servidores são máquinas profissionais projetadas para rodar 24/7, sem falhas e em tarefas mais complexas e que, por consequência, exigem maior poder de processamento. Esses computadores podem existir no formato de torres ou em formato de "gavetas" onde são empilhadas em hacks, para economia de espaço. Um único servidor pode ter mais de um processador da linha Xeon (Intel) e ter mais de 100 threads rodando simultaneamente, além de serem capazes de trabalhar com quantidades maiores de memória RAM e conexões de rede em relação às máquinas domésticas. Em geral, servidores são máquinas com performance superior aos PCs.

Embora seja totalmente possível rodar cálculos científicos em servidores e computadores domésticos, existem algumas situações nas quais o sistema e o nível de teoria escolhido resultarão em cálculos com alto custo computacional, i.e. que demandarão bastante tempo de trabalho ininterrupto dos computadores. Na verdade isso significa que as máquinas podem ficar em pico de processamento (100% de processamento) por dias, semanas e até meses. Neste sentido, embora seja possível, a realização desse tipo de cálculo em computadores domésticos pode estar além das capacidades para os quais eles foram projetados. Além disso, o fato das máquinas trabalharem sem descanso em seu potencial máximo faz com que o arrefecimento dos processadores seja um dos pontos mais críticos dos laboratórios de modelagem molecular. Há muitas boas razões para realizar cálculos em servidores, mas tecnicismo excessivo foge ao escopo deste programa de treinamento.

how-can-i-test-laptop-temperature-237761

É muito comum que leigos em modelagem molecular acreditem que podem fazer cálculos complexos em seus notebooks particulares. A depender do nível de teoria isso é uma verdade, e.g. realizar uma pequena otimização de geometria e/ou a busca conformacional através de cálculos de mecânica molecular não afeta em nada o funcionamento de um laptop. Entretanto, essas máquinas não são projetadas para ficarem dias a fio com processamento próximo de 100%. Adicionalmente, processadores de notebooks são, usualmente, focados em economia de energia, o que significa que sacrificar a performance em detrimento a algumas horas a mais de bateria. Em suma, os notebooks são ótimos equipamentos para cálculos leves e análise de dados, mas a ideia de realizar cálculos longos nesse tipo de equipamento não pode ser classificada com uma ótima idéia.

Cluster de servidores

Existem, fundamentalmente, dois tipos de cluster de servidores: O de alta disponibilidade e o de alto desempenho. Grosso modo, os clusters de alta disponibilidade possuem a intenção de absorver o impacto de algum tipo de problema no sistema de computadores. Eles em geral são usados em operações que, em nenhuma hipótese, podem parar (e.g. bancos de dados, sites de internet, etc.). Os clusters de interesse nesse treinamento, entretanto, são os de alta performance e também são chamados de cluster HPC - High performance computing. Em amplo aspecto, os clusters HPC são um conjunto de máquinas que funcionam como se fosse uma única. A intenção dos clusters HPC é "somar" os recursos computacionais de forma a permitir uma maior performance computacional. De forma resumida, os clusters HPC possuem a seguinte arquitetura fundamental: De forma breve, os clusters HPC podem ser descritos como 1 headnode ligado à vários slavenodes através de um switch de rede.

Captura_de_Tela_2020-08-28_às_18.43.23

Headnode

É a única máquina do cluster que se conecta à internet (para que os usuários tenham acesso remoto) e aos slavenodes através do switch de rede.  Em um cluster HPC os usuários apenas acessam o headnode e é lá que os softwares e os arquivos pessoais (input e output) dos cálculos ficam armazenados.

Slavenodes

São efetivamente as máquinas que trabalham no cluster. Os slavenodes, em geral, não possuem sistema operacional instalado e recebem esse nome pois obedecem as instruções de cálculo dadas pelo Headnode.

Sistema de filas

Para além de armazenar dados e ser a interface de interação com os usuários do cluster HPC, o headnode possui um software que organiza um sistema de filas e que distribui de maneira automática os cálculos solicitados pelos usuários, segundo critérios pré-estabelecidos. Graças ao sistema de filas, um cluster HPC não para de trabalhar em nenhuma circunstância, o que aumenta (em muito) o aproveitamento dos recursos computacionais.

Por si só, a realização de cálculos pode variar ligeiramente se for feita em um computador doméstico/servidor isolado (standalone) ou em um cluster de servidores, mas (em essência) sempre serão necessários dos mesmos três passos:

  • Passo 1: Montar um arquivo de entrada (input)

Um arquivo de entrada (input) nada mais é do que um arquivo de texto, geralmente dividido em duas seções: (i) Instruções para o software de cálculo e (ii) coordenadas de cada átomo do sistema. Em si, a estrutura do arquivo de entrada é bastante dependente do programa que está sendo trabalhado. A figura abaixo demonstra dois arquivos de entrada montados exatamente para um mesmo sistema (1 molécula de água), mas para softwares diferentes: Gaussian (esquerda) e Gamess (direita).  Embora em ambos os casos as instruções sejam as mesmas (cálculo de energia, HF/STO-3G) a maneira de estruturar essas informações é diferente para cada programa.

Felizmente há programas com interface gráfica que facilitam esse trabalho (e.g. Avogadro). Essa etapa de montagem do input pode ser feita em computadores pessoais, uma vez que não exige esforço computacional significativo. O modus operandi de cada software será tratado em particular na ETAPA 4 deste treinamento.

Captura_de_Tela_2020-08-28_às_19.33.17
  • Passo 2: Localizar seu arquivo de entrada (via terminal) e escrever o comando correspondente de cada software

O passo 2 pode ser o passo mais simples, mas também pode ser o mais demorado de todos. Fundamentalmente o usuário precisará localizar o arquivo de input (via terminal) e aguardar que o computador termine a tarefa. Ao final de todo processo, haverá um arquivo de saída (output) com o resultado do cálculo, segundo o esquema abaixo.

IMPORTANTE: O fato do computador ter parado de processar os dados relacionados ao cálculo não significa, por si só, que o arquivo de saída seja uma resposta para o problema investigado. Na verdade é bastante comum que o cálculo apresente erros diversos (e.g. problemas de estrutura, má seleção de parâmetros de cálculo, falta de recurso computacional suficiente, etc...). Nesses casos o cálculo para e o arquivo de saída precisa ser lido para entender qual foi o problema. Por sorte, a comunidade científica é solidária e os membros que utilizam determinados programas tem fóruns de apoio. É altamente recomendável que o usuário de um programa de um participe dos fóruns de discussão dele.

Captura_de_Tela_2019-04-03_às_19.21.25.p
  • Passo 3: Recolher o resultado do cálculo e analisá-lo (output).

Ao final do processamento, o arquivo de output será gerado. A análise dele pode ser feito em modo texto (no terminal mesmo) ou através do modo gráfico, em algum software de visualização. Independente da maneira com o resultado será analisado, isso pode ser feito em um computador pessoal, uma vez que não é computacionalmente extenuante. A análise dos cálculos deveria ser uma etapa bastante criteriosa para um pesquisador, uma vez que é nesta etapa que a literatura especializada deverá ser confrontada.

ETAPA 4. Aspectos operacionais dos softwares utilizados

Nesta etapa do treinamento a ideia central é experimentar pela primeira vez alguns softwares que podem ser úteis no desenvolvimento dos trabalhos do LECiC/GIEESAA. A curadoria de qual treinamento será mais útil dependerá de cada projeto e deve ser alvo da discussão do estudante com o orientador do trabalho.

Avogadro.png
imgingest-2006276125388651848.png
MacMolPltIcon.gif
Captura_de_Tela_2018-10-30_às_09.38.41.p
TuHbpUEd.jpg
logo_header.jpg

ETAPA 5: Redação Científica

IMPORTANTE

Esta seção do treinamento não intenta ensinar o processo da escrita em si e, muito menos, criar um juízo de valor a respeito da qualidade da redação e do emprego das melhores palavras entre uma pessoa e outra.  Há muitas formas de escrever uma mesma informação e, em geral, há  diferenças sutis entre entre as áreas do conhecimento. No meio das ciências naturais, por exemplo, há uma grande preocupação em detalhar os métodos e metodologias que conduziram a um determinado resultado, de forma a permitir a reprodução dos experimentos/cálculos.

A ideia desta seção é treinar o estudante, em aspectos gerais, para produzir os relatórios que o LECiC/GIEESAA considera mais adequado aos trabalhos que são desenvolvidos nos laboratórios do grupo. Desta forma, todo texto abaixo considera apenas a opinião dos orientadores do grupo e não uma verdade absoluta e inexorável.

Há excelentes textos e vídeos sobre o tema. Encoraja-se o estudante a ser diligente nesse tema tão rico e complexo.

1. Porque reportar os trabalhos?

Em termos da evolução humana, indivíduos de Homo neanderthalensis e Homo sapiens coexistiram por anos. Modernamente, entretanto, não há relato de outros hominídeos afora os representantes da espécie H. sapiens. É difícil saber, exatamente, o por quê os H. neanderthalensis foram extintos, mas as hipóteses mais atuais consideram que possa haver uma grande diferença de sociabilidade entre os neandertais e o homem moderno. Enquanto as tribos ancestrais de H. sapiens eram capazes de cooperar entre si, é provável que a outra espécie de hominídeos não (Kochyiama, 2018). Desta forma, embora pareça estranho, é possível explicar os motivos pelos quais a divulgação de trabalhos científicos deva ser feita baseado em um dos (prováveis) motivos pelos quais o Homo neanderthalensis foi extinto. Deste modo, a capacidade de cooperação entre os cientistas e, por conseguinte, a evolução da ciência como um todo é o grande motivo de reportar as metodologias, resultados e conclusões de pesquisas científicas.

Grosso modo, o método científico pode ser compreendido com um processo pelo qual um investigador formula conclusões a respeito de um fenômeno (natural, social, etc.) e como ele as compartilha. Essas informações, compartilhadas, são analisadas por outros pesquisadores de forma a considerá-las na formulação de novas hipóteses - sobre o mesmo ou sobre fenômenos diferentes. Ou seja, as hipótese formuladas por outrem são testadas de forma a serem confirmadas ou refutadas por pesquisadores independentes. Sem verdades absolutas. Por si só, esse processo dá origem a um ciclo virtuoso de observação de fenômenos, formulação de questionamentos/hipóteses, realização/análise de experimentos e do refinamento das conclusões a respeito de um fenômeno. O processo em si não é perfeito, mas dentro do racionalismo humano é a maneira mais efetiva já inventada pelo homem para conhecer cada vez mais a respeito do mundo.

É imperativo que as informações contidas em textos científicos sejam passíveis de reprodução e inteligíveis a todos os pesquisadores de uma determinada área. Desta forma, há uma maneira muito específica de reportar os resultados de uma investigação que deve levar em consideração, a clareza, a concisão das informações e, sobretudo, o máximo detalhamento a respeito dos processos.

Captura_de_Tela_2020-09-02_às_15.15.51

2. A escolha das boas referências.

Diferente da opinião, o texto científico é sempre fundamentado em conclusões pregressas, de outros trabalhos publicados. Deste modo, os resultados dos experimentos, devem endossar ou refutar as primeiras hipóteses e, eventualmente, fomentar o formulação de outras. Em certa medida, a escrita acadêmica sempre depende de outros trabalhos e a fiabilidade das novas hipóteses depende diretamente das hipóteses/conclusões anteriores. Neste contexto, as referências que devem ser consultadas são sempre os artigos científicos, preferencialmente indexados em periódicos de grande circulação, i.e. que sofrem o escrutínio de um número maior de pesquisadores.

 

Na etapa 0 deste treinamento são expostas razões suficientes para justificar o porquê os artigos científicos são a forma mais confiável (mas não infalível) de comunicação científica. Por uma questão de abrangência de leitores é comum que mesmo periódicos nacionais de grande circulação adotem a língua inglesa em suas publicações (e.g. JBCS ; JCCS; etc.).

É importante ressaltar, entretanto, que também há excelentes e confiáveis publicações em língua portuguesa mas que, por uma questão de barreira linguística são menos acessíveis do que outras em língua inglesa, sendo menos escrutinadas.

Em um trabalho científico é necessário que o pesquisador tenha conhecimento das publicações pregressas, desta forma, a atualização da bibliografia deve ser feita de forma constante  e metódica. Nesse contexto, a seleção de palavras-chave e o domínio dos motores de busca (discutidos na etapa 0 deste treinamento, pode ser a diferença entre um bom trabalho e um texto mediano.

unnamed.jpg

3. A estrutura do trabalho

Embora para certas áreas do conhecimento pareça haver uma estrutura mais ou menos definida, não há uma norma única que determine como um texto científico deva ser escrito. No caso dos periódicos e dos relatórios de agência de fomento, há formatos proprietários que variam bastante. A maioria, inclusive, tem as seções bem definidas, inclusive, com regramento em relação ao número de palavras. Monografias, dissertações e teses são normatizadas por regras institucionais. No caso da UFRJ, o SiBi (Sistemas de Bibliotecas) produz manuais próprios, baseados nas normas da Associação Brasileira de Normas Técnicas (ABNT).

Considerando um documento de formatação livre (e.g. monografia), sugere-se a divisão da parte textual em:

A) Resumo

O resumo deve ser conciso e direto, além de abordar a essência do trabalho. De maneira geral, o resumo se divide em duas partes contíguas. A primeira que descreve, sem maiores detalhes, o contexto do trabalho e/ou técnicas empregadas de forma a dar ao leitor um panorama geral do trabalho. A segunda parte, deve trazer os principais resultados e conclusões do trabalho. O resumo deve ser encarado como uma forma de dar ao leitor uma prévia do que foi trabalhado. Por isso, os resumos não possuem referências, uma vez que considera-se que o trabalho as tenha. Embora seja um dos primeiros elementos textuais, o resumo deve ser a última seção do texto a ser escrita. É importante ressaltar que é necessário ter uma ideia do todo para que o resumo o represente.

B) Abstract

É uma maneira de democratizar, ainda que parcialmente, a limitação do idioma. Como o português e a língua inglesa possuem construções de sentenças bastante diferentes, o abstract não precisa ser uma tradução literal do resumo, mas uma versão em inglês. Há boas ferramentas que ajudam na construção de textos em inglês, dentre elas destacas-se o Grammarly.

Captura_de_Tela_2020-09-02_às_20.25.22

C) Introdução

A introdução de um trabalho deve ser a parte onde o autor endereça ao leitor informações úteis na compreensão global do que está sendo tratado. Esta seção deve compreender os aspectos mais genéricos do campo de trabalho e chegar nas questões mais específicas. Deve ficar explicito, também, na introdução qual é a inovação do trabalho, de forma que o leitor fique instigado a ler todo resto. A introdução deve ter referências bibliográficas, mas não deve ser subdividida. É comum que o último parágrafo da introdução inicie com uma frase semelhante a:

"A proposta deste trabalho é, justamente, avaliar 39 inibidores de corrosão com o auxílio da teoria do funcional de densidade (DFT)..."

D) Revisão da Literatura

Geralmente ausente em artigos, a revisão da literatura, como o próprio nome sugere deve contemplar uma análise dos trabalhos já publicados em uma determinada área do conhecimento. Na revisão da literatura, deve-se dissertar mais extensamente a respeito de sub-tópicos que envolvem o assunto tratado no trabalho, fazendo uso de exemplos da literatura

E) Fundamentação teórica

É uma seção opcional, mas muito comum na área de química teórica. Nesta seção, o autor expõe - com suas próprias palavras, o formalismo matemático dos métodos teóricos usados por ele.

F) Revisão da Literatura

Geralmente ausente em artigos, a revisão da literatura, como o próprio nome sugere deve contemplar uma análise dos trabalhos já publicados em uma determinada área do conhecimento. Na revisão da literatura, deve-se dissertar mais extensamente a respeito de sub-tópicos que envolvem o assunto tratado no trabalho, fazendo uso de exemplos da literatura.

Embora seja comum em textos da área das humanidades, é incomum que na área de modelagem molecular os autores utilizem o recurso de citação direta ao referir-se ao trabalho de outrem. Ao invés disso, é habitual que se faça uso das informações (metodologia/resultados e conclusões) na forma de relato, de forma a integrar e endossar/refutar uma linha de pensamento.

Análise do trecho ao lado

Contexto: O excerto de texto foi retirado de um trabalho onde o autor estava propondo a aplicação de métodos ab initio para o cálculo para o estudo de inibidores de corrosão.

 

Observações: Nesse contexto, ele usou o trabalho de Martinez e Stagljar (2003), no qual os inibidores de corrosão eram estudados por métodos semi-empíricos. Após descrever os métodos e os principais resultados da literatura, o autor fez uma análise, de forma a endossar a maior consistência  da sua proposta em relação à publicada.

Esse tipo de estratégia deve ser usada em capítulos de revisão da literatura, uma vez que reforça a importância do trabalho desenvolvido frente à outros já realizados, i.e. reitera o caráter inovador e meritório da pesquisa que está sendo reportada.

Captura_de_Tela_2020-09-02_às_20.35.12

G) Objetivos

Geralmente ausente em artigos, a seção de 'objetivos' é onde o autor demonstra clara e explicitamente quais são as intenções do trabalho. Os objetivos de um trabalho são sempre iniciados por verbos (Estudar, Realizar, Comparar, Analisar, Sondar, etc.). É recomendável que os objetivos sejam feitos em itens. Nos trabalho do LECiC/GIEESAA os objetivos são divididos em:

 - Objetivo central:

Deve ser o principal objetivo do trabalho. É um único objetivo, obrigatoriamente.

Ex: "Estudar à luz da teoria do funcional de densidade (DFT) os inibidores de corrosão oriundos..."

 - Objetivos específicos :

Os objetivos específicos devem contemplar os objetivos relacionados ao trabalho

Ex: "Avaliar os funcionais B3LYP, PW91 e revPBE nos parâmetros geométricos das células unitária de..."

 - Objetivos colaterais

Os objetivos colaterais são uma inovação do nosso grupo e devem contemplar decorrentes do trabalho, mas que não possui relação direta com sua realização. Deve-se usar esta seção para reiterar a importância do trabalho em relação à uma área de conhecimento ou à cooperação entre grupos de pesquisa

Ex: Fortalecer a cooperação interunidade entre a Escola de Belas Artes e o Instituto de Química.

​​​

Captura_de_Tela_2020-09-02_às_23.05.54

G) Metodologia

A metodologia de um trabalho é uma das seções mais importantes, uma vez que é através dela que reprodutibilidade dos experimentos/cálculos é alcançada. Tudo que puder ser reportado deve ser, uma vez que os mínimos detalhes podem ser importantes.

Em poucas palavras, a metodologia diz respeito a "como o trabalho foi feito, em detalhes".

Não cabe nesta seção discutir os motivos pelos quais uma determinada análise foi escolhida e/ou se há abordagens mais, ou menos, adequadas.

Análise do trecho ao lado

O trecho ao lado é descrição experimental de uma análise de Ressonância Magnética Nuclear.

O autor expõe no artigo desde a aquisição e armazenamento da amostra (sub-seção 2.1), até os mínimos detalhes de calibração do espectrômetro de  de RMN. Em linguajar técnico, a seção 2.2 fornece todas as condições necessárias para que outro espectroscopista de RMN possa reproduzir e escrutinar os resultados expostos nesse trabalho.

H) Resultados e Discussão

Resultados e discussão é a seção do trabalho onde deve haver um confronto direto entre os resultados do autor e suas reflexões, embasadas por outros de trabalhos previamente publicados. É comum que iniciantes na pesquisa expressem, de forma confusa, os resultados da literatura de forma que pareçam ter sido obtidos no trabalho corrente. Por si só isso é um erro, daí a importância de produzir um texto claro e direto. Outro erro comum é que aconteça uma troca na ordem entre os resultados e discussão. Por exemplo:

Captura_de_Tela_2020-09-03_às_09.30.30

A qualidade da seção de resultados e discussão depende, portanto, do aprofundamento do autor em um determinado campo do conhecimento. Por isso, a leitura diuturna e aprofundada dos trabalhos mais relevantes da área é um dos pré-requisitos que garantem a escrita de um bom texto acadêmico.

Análise do trecho ao lado

A ordem de exposição SEMPRE deve ser:

- Resultados do trabalho (texto, tabela, imagens, etc.)

- Discussão fundamentada na literatura

I) Conclusões

Em termos práticos, as conclusões de um trabalho acadêmico devem ser uma consequência natural da discussão dos resultados.

J) Perspectivas

O fim de um trabalho acadêmico produtivo é, usualmente, fruto do findar de algum prazo, uma vez que é raro que uma investigação científica acabe em si mesma. O mais comum é que as conclusões de um trabalho acadêmico respondam algumas perguntas e que provoquem outras. Desta forma, a seção de perspectivas deve ser usada para expor maneiras de dar continuidade ao trabalho. A seção de perspectivas é usualmente ausente em artigos.

K) Referências

Não há uma única regra de determine a citação de referências bibliográficas de maneira unificada. No Brasil, a ABNT normatiza a citação bibliográfica, entretanto, em diferentes periódicos possuem normas próprias.

O manejo de referências bibliográficas pode ser um entrave para diversos pesquisadores, mas felizmente há bons programas gratuitos e que podem ser úteis nesta tarefa. O Mendeley seja, talvez, o mais popular entre os softwares multiplataforma.

L) Agradecimentos

Essa seção dos trabalhos deve ser dedicada às pessoas/instituições que contribuíram para a realização da pesquisa. Não é o local de agradecer a nenhum ente querido.

Todas as bolsas recebidas pelos alunos do LECiC/GIEESAA possuem uma cláusula na qual o estudante precisa declarar agradecimentos à agência de fomento

4. Dicas de redação científica

- O uso de boas referências, de maneira correta.

Uma das principais questões que comprometem a redação científica é a falta de referências adequadas. É comum que iniciantes tenham a barreira da língua inglesa e prefiram buscar como referências uma verdadeira enxurrada de teses e e dissertações em português. Em si, a citação de uma dissertação/tese não é um erro, mas deve-se sempre preferir o artigo derivado da mesma, uma vez que o sistema de avaliação por pares e o escrutínio contínuo das informações provê maior segurança. Outra questão, que também afeta a qualidade de textos científicos, diz respeito à citação de referências secundárias (denunciadas muitas vezes pelo excesso de apud - a citação da citação).

O autor do texto também deve observar recursos linguísticos para que a forma de citar uma determinada referência torne o texto enfadonho. Desta forma, o já combalido "Segundo Pereira et al (2012)" deve ser evitado e dar lugar à "Pereira e seus colaboradores afirmaram", dentre outros.

- Linguagem direta, frases curtas

Na área das ciências naturais, é mais comum que os textos científicos sejam formulados por frases curtas, com informações diretas. Raramente as sentenças devem ter mais que três linhas de texto em Arial 12.

- Tabelas, figuras, estruturas químicas, esquemas e equações

É altamente recomendável e preferível que a exposição de dados sejam feitas por tabelas, figuras, estruturas químicas, esquemas e equações. Isso, de forma geral, aumenta a densidade de informação no trabalho. Trabalhos enormes não significam, necessariamente, que sejam excelentes. Em vários casos há baixa densidade de informação pela inabilidade de concisão do autor.

- Evitar citações diretas

Não obstante seja comum em textos da área das humanidades, é incomum que na área de modelagem molecular os autores utilizem o recurso de citação direta ao referir-se ao trabalho de outrem.

- Linguagem impessoal e sem gerúndios.

Embora não seja uma regra é mais comum que textos científicos, ao menos na área das ciências naturais, utilizem redação em linguagem impessoal. Deste modo, o uso de verbos em primeira e/ou terceira pessoa deve ser evitado ao máximo. Em linha, os gerúndios acaba por não trazer elegância em redações científicas.

ETAPA 6 - Apresentação de Trabalhos

IMPORTANTE

A ideia desta seção é treinar o estudante, em aspectos gerais, para elaborar apresentações tipo como as feitas pelo Microsoft Powerpoint. Desta forma, todo texto abaixo considera apenas a opinião dos orientadores do grupo e não uma verdade absoluta e inexorável.

Há excelentes textos e vídeos sobre o tema. Encoraja-se o estudante a ser diligente nesse tema tão rico e complexo.

É comum que o aspirante a pesquisador tenha que expor o tema e os resultados da sua pesquisa não apenas de forma escrita, mas em uma sustentação oral. Nesta seção, serão dadas algumas dicas capazes de fazer as apresentações mais adequadas ao ambiente acadêmico.

1. Antecedência e treinamento constante e respeito ao tempo.

Embora pareça óbvio, preparar uma apresentação com antecedência, aumenta muito o risco de fazer uma boa exposição dos dados, além de permitir que se invista tempo na melhoria e na realização de quantas prévias forem necessárias. O nervosismo durante uma apresentação é inversamente proporcional ao número de treinos. Também é um mito que haja pessoas que apresentem melhor do que outras. Em geral, os bons apresentadores contam com anos de preparo (no caso de professores). Há sim, pessoas que precisam treinar um pouco mais para chegar a um patamar satisfatório, i.e. é uma questão cinética não termodinâmica.

 

De todo modo, todas as apresentações devem respeitar o tempo dado pela organização do evento e isso deve ser levado em consideração no momento das prévias. Violar o tempo limite de uma apresentação é uma falta grave e, no caso de concursos públicos, conduz o candidato à eliminação sumária do processo de seleção.

2. Postura & linguajar

É muito importante ser formal durante uma apresentação científica. Desta forma, estar formalmente trajado é tão importante quanto o conteúdo que será ministrado. É importante, também, deixar de lado as brincadeiras, as gírias e as palavras de baixo calão. A ideia de uma apresentação científica é comunicar ao público o que está sendo desenvolvido e não divertir os espectadores, naquele instante.

A leitura de slides ou textos de apoio é um pecado imperdoável. Além disso, é altamente contra-recomendado que o apresentador faça a apresentação sentado. Apresentações em que o apresentador está lendo (os slides e/ou papéis de apoio) e sentado tendem a ser enfadonhas e passam insegurança à audiência. Em apresentações, ser dinâmico é essencial.

3. Apontador laser

É muito comum que o apresentador utilize um apontador laser para destacar detalhes importantes da sua apresentação. Deve-se tomar cuidado, entretanto, para que esse equipamento esteja destinado única e exclusivamente a apontar detalhes. É uma falha grave manter o laser ligado sem indicar algo que mereça destaque.

Sem Título.001.jpeg

4. Estrutura fundamental dos slides

É altamente recomendado que os slides tenham fundo branco (ou que ao menos sejam claros). Backgrounds escuros são, via de regra, mais cansativos aos espectadores. Em paralelo, há maior disponibilidade de figuras com fundo branco, o que facilita a edição das imagens e sobreposição de, eventuais textos.

Raramente é necessário produzir slides que contenham única e exclusivamente textos. Esses slides devem existir apenas quando há necessidade de destacar uma legislação ou a fala de algum personagem importante.

Uma boa apresentação deve ter pelo menos 4 partes distintas:

- Capa

- Sumário

- Desenvolvimento

- Agradecimentos

Nestas partes, destaca-se:

A - Identificação Institucional

B- Título

C - Identificação do apresentador e filiação científica

D - Equipe de orientação do trabalho

F - Sub-título, também chamado de título do slide.

G - Páginação da apresentação

H - Referências

I - Equações e figuras em tamanho grande

J - Agradecimento à colaboradores e instituições

PS: Em apresentação de experimentos/cálculos, é necessário também criar um slide de metodologia e a ordem fica um pouco diferente:

- Capa

- Sumário

- Introdução

- Metodologia

- Resultados e Discussão

- Conclusões

- Agradecimentos

DICA IMPORTANTE

É altamente recomendado que durante a elaboração da apresentação e os treinos prévios, o estudante exercite sua capacidade imaginativa, ao tentar adivinhar perguntas possíveis que podem ser feitas pela banca ou pela audiência do local.

Essas perguntas devem ser respondidas com os chamados slides-extra e que ficam posicionados logo depois do slide de agradecimento.

ETAPA 7. Trabalho final tutoriado

Nesta etapa do treinamento o estudante deverá por à prova os conhecimentos fundamentais (e míminos) a respeito da teoria que permeia a área de química computacional envolvida nos projetos do LECiC/GIEESAA. Propõe-se aqui realizar e interpretar alguns cálculos de primeiros princípios, analisar e estabelecer conclusões a respeito dos cálculos realizados e fazer uma pequena apresentação desses resultados. De forma geral, simula-se aqui um processo completo de investigação típica em química computacional.

t.e.o.r.i.a

Em termos de conhecimentos teóricos, não espera-se que (nesta etapa da formação) o estudante domine com perfeição o formalismo  matemáticos da teoria, mas que compreenda, em mínimo grau, a ideia por de trás dos cálculos que executa. Na seção de teoria, pede-se que o estudante responda às questões propostas propostas abaixo:

1.1. No contexto da química computacional, qual a diferença entre métodos quânticos e clássicos ? Quais as vantagens e limitações de cada método?

1.2. O que é o método de Hartree-Fock? Qual é a importância desse método para a Química quântica computacional?

1.3. O que são métodos semi-empíricos?! Qual a utilidade e limitação deles?

​​

 

Captura_de_Tela_2020-09-04_às_14.30.51

1.4. No artigo ao lado, os autores usaram a teoria do funcional de densidade (DFT) para estudar a degradação de papéis antigos. Neste caso, o título do artigo se justifica? Justifique sua resposta.

1.4. Uma sigla bastante comum em cálculos quânticos é 'scf'. O que ela significa? Explique como ela se insere na química quântica computacional.

1.5. A DFT é um dos métodos mais populares da química computacional. Escreva com suas palavras seu entendimento sobre este método de cálculo.

1.6. O que são funcionais? O que eles significam no contexto dos cálculos por DFT?

1.7. O que são funções de base? O que elas significam no contexto dos cálculos quânticos?!

1.8. Porque as otimizações de geometria são tão importantes em cálculos de primeiros princípios?

1.9. O que significa o critério de convergência de um cálculo? Cite exemplos hipotéticos.

1.10. No artigo Zaccaron et al. J. Coord. Chem. 66(10), p. 1709-1719 (2013), os autores utilizam a química computacional para estudar a interação do ácido gálico com metais (semelhante ao que acontece com a tinta ferrogálica) e para isso utilizam diferentes metodologias teóricas. Analise  a seção 'computational details'.

a) O que é o 'MMFF94' usado no trabalho? Qual a função desse algoritmo nos cálculos que foram feitas neste artigo? Existe algum outro algoritmo que possa ser usado neste caso?

b) O que significa PBEPBE, B3PW91 e M06? Qual a função desses algoritmos nos cálculos feitos no trabalho?

c) Os autores usaram D95V como funções de base. O que isso significa?

P.R.Á.T.I.C.A.S  C.O.M.p.U.t.a.c.i.o.n.ai.s

As práticas computacionais propostas nesse módulo, terão duas intenções:

 

Parte 1 - Práticas de fixação | Serão práticas computacionais com moléculas simples, com objetivo de:

- Construir e comparar modelos teóricos

- Submeter cálculos em diferentes metodologias quânticas

- Analisar os resultados de cálculo a partir de outputs

Parte 2 - Práticas para construção do resumo | Será um conjunto de cálculos para uma mesma molécula, com o objetivo de:

- Construir e compara modelos teóricos

- Submeter cálculos por DFT

- Analisar os resultados de cálculo a partir de outputs

- Extrair os dados para escrever um resumo

R.e.s.u.m.o | a.b.s.t.r.a.c.t

Nesta seção do treinamento, o estudante deverá usar os resultados dos cálculos da segunda da segunda parte das práticas computacionais para elaborar um resumo (português e inglês), como os elaborados em congressos. Para tornar o treinamento ainda mais realístico, será adotado o modelo usado pela Sociedade Brasileira de Química - SBQ, na reunião anual de 2016.

A.p.r.e.s.e.s.e.n.t.a.ç.ã.o

A apresentação de slides deverá ser feita em 15 minutos e deverá conter, pelo menos:

 

- Capa

- Sumário

- Introdução

- Metodologia

- Resultados e Discussão

- Conclusões

- Agradecimentos

Clique aqui para baixar um modelo proposto pelo LECiC.

© 2020 por Laboratório de Estudos em Ciências da Conservação. | webmaster: Daniel L. M. de Aguiar | Visitantes:

bottom of page