Machine Transal...'s profileMachine Translation - th...PhotosBlog Tools Help

Blog


    May 27

    Jump = brokenTranslation x 2

    I'm using my lunch break to blog about a new feature that I implemented yesterday and will probably be the first that will raise eyebrows from my fellow colleagues here in MSR-MT... I'll get to it soon, but first here's some background (a faded attempt to prove that I'm not THAT crazy...): if you somewhat follow machine translation you probably noticed that many other online translators offer more language combinations than we (http://translator.live.com) do. While some of these offerings are totally legit and deserve all respect, some are well... uh... not so straightforward. The reason is actually quite simple: some tools use English as the middle ground for translations they don't support natively. What this means is that  the user (most of the time without knowing) sends a sentence that is first translated to English, and then translated to the target language. The result as you probably can guess is a broken translation multiplied by two...

    That said, I must stay true to my own self imposed mantra - any translation is better than no translation - right? So why not try this uh... technique and see how people react? I though about it for a while and decided to make this selection very explicit to the user as opposed to hiding it as just yet another menu selection. Long story short: we now have a new command - bot*jump [code of the language] - that works for all languages but English and tells the bot to translate twice (X to English and then English to Y). Here is the video clip describing a typical session:

     

     

    The overall result is that now all 10 languages supported by the greetings (I still don't have Korean resources :-( ) can be translated to any of the 11 target languages - 110 language pairs???!!!

    The codes of the languages are as follows:

    pt: Portuguese
    de: German
    es: Spanish
    zh-chs: Chinese Simplified
    zh-cht: Chinese Traditional
    ja: Japanese
    it: Italian
    ar: Arabic
    fr: French
    ko: Korean
    nl: Dutch

    Again, let me try to be clear: this is just a test! It's no indication whatsoever of any attempt to implement the same technique on our product! As I said before, some colleagues will probably egg me when they find out what I did...

    Comments are welcome!

    Helvecio

    English - Portuguese

    Eu estou usando minha pausa para o almoço para escrever sobre uma nova feature que eu implementei ontem e que provavelmente será a primeira que levantará as sobrancelhas de meus colegas companheiros aqui em MSR-MT… Eu explico logo, mas primeiramente vou tentar dar algum fundamento básico (uma tentativa desvanecida de mostrar que eu não sou louco…): se você segue artigos de tradução automática você provavelmente já observou que muitos outros tradutores online oferecem mais combinações de idiomas do que nós (http://translator.live.com). Embora algumas (a maioria) destas implementaçoes sejam totalmente legitimas e merecerem todo o respeito, alguns são… uh bem… não tão corretas. A razão é realmente simples: algumas ferramentas usam inglês como passo intermediario para traduções entre idiomas que não suportam de forma nativa. O que isto significa é que  o usuário (na maioria das vezes sem saber) emite uma sentença para que seja traduzida primeiramente ao inglês, e em seguida traduzida então à língua destino. O resultado como você provavelmente pode supor é uma tradução quebrada multiplicada por dois…

    Isso dito, eu devo permanecer verdadeiro a minha própria mantra  - alguma tradução é melhor do que nenhuma tradução - certo? Assim porque não tentar esta uh…técnica e considerar como os usuários reagem? Eu pensei sobre como implementar este modo e decidi por fazer esta seleção muito explícita ao usuário ao contrário de esconde-la como sendo apenas uma outra seleção de menu. Abreviando a história: nós temos agora um comando novo - bot*jump [código da língua] - que funciona para todas as línguas menos inglês e diz o bot para traduzir duas vezes (X ao inglês e então do inglês a Y). Está aqui o videoclip que descreve uma sessão típica:

    O resultado total é que agora todas as 10 línguas suportadas pelos Greetings (eu ainda não tenho recursos em Coreano :-( ) pode ser traduzidas para qualquer das 11 línguas destino - 110 pares de idiomas???!!!

    Os códigos das línguas são como segue:

    pt: Português
    de: Alemão
    es: Espanhol
    zh-chs: Chinês simplificado
    zh-cht: Tradicional chinês
    ja: Japonês
    it: Italiano
    ar: Árabe
    fr: Francês
    ko: Coreano
    nl: Holandês

    Bom agora eu vou tentar deixa algo bem claro: este é apenas um teste! Não é nenhuma indicação de que nosso produto vá  utilizar uma tequinica similar! Como eu disse antes, alguns colegas provavelmente vão me encher de ovos quando descobrirem o que eu fiz…

    Comentários são bem-vindos!

    Helvecio


    May 22

    Portable translator ??? What Portable Translator ???/ Tradutor Portatil? Que Tradutor Portatil ???

    Well, I guess it's pretty clear by now that I'm not good at Marketing... If there's a reason I will never get rich is my total inaptitude to spin things around so that they look more complicated than they really are :-). I guess this is yet another good example...

    One of the driving motivators for me to start the prototype project about one year ago (in the form of a bot) was the fact that Messenger is everywhere - those guys have tons of clients: desktops, tablets, web (thin), and Smartphones. Leveraging their tremendous penetration power would mean that every Messenger client can be in fact a bot client, thus a Translator.

    That said, ever since the bot was released one year ago everyone that carries a Smartphone around has a portable translator... That's right, folks: it's as simple as connecting two existing technologies together... So, if you had problems trying to find your way back to the hotel in your last trip to another country don't blame me! Also, the Messenger web clients should work with other portable devices, so it does get better: everyone that has a phone that can access the web has a portable translator!

    I've talked about this scenario to some people during TechFest and during the Summit as well. Most people where really surprised to find out this option exists (even people in my group didn't realize it), so I guess it deserves a blog...

    And here is the video demo of the Messenger thin client running on my Pocket PC 2003:

     

     

    The only annoying thing about the thin clients (all of them) is that you have to keep on clicking 'Refresh' to get the response faster (otherwise you have to wait a couple of seconds). If you have a Smartphone with Messenger Mobile the experience is much better, and you can even use the Text-to-Speech feature (bot*say) to play audio back (if you are really asking for help you'll find that some fonts can be quite hard to read).

    So when you go to Beijing for the Summer Olympics take the bot with you (someone from Mobile should create an add with this... Oh well...).

    English - Portuguese

    Bem, eu suponho que a essa altura do campeonato já seja bem claro que eu não sou bom  de Marketing… Se há uma razão eu nunca vou ser rico é minha inaptitude total para manipular coisas de modo que pareçam mais complicadas do que elas são :-). Eu achoe que este é um outro bom exemplo…

    Um dos fatores que me motivaram para começar o projeto do protótipo aproximadamente há um ano (sob a forma de um bot) era o fato de que o Messenger está em toda parte - eles tem toneladas de clientes: desktops, tablets, web, e Smartphones. Aproveitar esse tremendo poder da penetração significaria que cada cliente do Messenger poderia ser de facto um cliente do bot, portanto um tradutor.

    Esse dito, depois que o bot foi liberado um ano há todos que carregam um Smartphone por ai tem um tradutor portátil… E' isso mesmo gente: é tão simples quanto conectar duas tecnologias existentes junto… Assim, se você teve problemas tentando encontrar seu caminho de volta ao hotel em sua última viagem a um outro país não me responsabilize! E tem mais:os web client do Messenger funcionam com outros dispositivos portáteis, assim todos que tem um celular que possa acessar a web tem um tradutor portátil!

    Eu cheguei a falar sobre este cenário durante TechFest e durante o Summit também. A maioria ficou surpreendida em saber que esta opção existe (mesmo gente em meu grupo não tinham conectado os dots), assim eu acho que merece um blogue…

    E está aqui o video do Messenger web client que funciona em meu Pocket PC 2003...

    A única coisa irritante sobre os Messenger webclients (todos, nao so' o MSN) é que você tem que se manter no clique “Refresh” para receber a resposta mais rápida (se não você tem que esperar um par segundos). Se você tem um Smartphone com Messenger Mobile a experiência é muito melhor, e você pode mesmo usar a característica Text-to-Speech (bot*say) para tocar o áudio (se você está pedindo realmente a ajuda vai descobrir rapidinho que algums tipos de letras podem ser realmente duras de ler).

    Assim quando você vai a Pequim para os Jogos Olímpicos de Verão levee o bot com você (alguém do Mobile deveria criar um comercial com essa idea… Bom, fazer o que, ne'?…).


    May 21

    Spaces Gadget is broken!/ O gadget do SPaces esta' quebrado.

    The Spaces gadget is not working. I believe it's actually broken for a while - the last time I checked was during the demos in Panama last week... The problem seems to be related to the Preferences (blog address, languages, etc) that are stored as metadata by Spaces  - when I read it back everything is returning null, and you end up with an 'undefined' url.

    I've posted a question to the Forum (http://boards.live.com/Windows%20Live%20Gallery%20Forumboards/thread.aspx?threadid=674530) and I'll try to get it up again as soon as possible.

    English - Portuguese

    O Spaces gadget não está funcionando. Eu acredito que esta' quebrado por um tempo - a última vez onde eu verifiquei foi durante as demos no Panamá na semana passada… O problema parece ser relacionado às preferências (endereço do blogue, idiomas, etc.) que são armazenadas como metadata pelo Spaces  - quando eu o leio os dados tudo está retornando null, e você termina com um URL “indeterminado”.

    Eu afixei uma pergunta ao fórum (http://boards.live.com/Windows_20Live_20Gallery_20Forumboards/thread.aspx?threadid=674530) e vou tentar re-configurar o mais cedo possível.


    May 20

    LATAM Academic Summit 2008

    I'm lazy, and not ashamed to admit... That said, I'm going to copy part of my trip report instead of writing an original blog (well, I'll remove a couple of bullets that may contain some "smart ideas"). Let's see how boring can I get...

    "As some of you know, I was in Panama City last week, attending the Microsoft Research Academic Summit 2008 . The event was sponsored and managed by the LATAM academic connections division, and had (according to the organization staff) 200+ people attending.

    Here’s a quick recap of the events I attended:

    - Breakout sessions: many sessions running in parallel. I’d like to highlight two:

    - “Porsimples: Simplification of Portuguese texts for digital inclusion and accessibility”  - Thiago Pardo • Professor • University of São Paulo (São Carlos)

    Professor Thiago presented a really interesting concept for simplifying Brazilian Portuguese texts.

    - “Human Computation” - Luis Von Ahn • Assistant Professor • Carnegie Mellon University

    Prof. Von Ahn is the mastermind behind the Captcha project and its successor re-Captcha. My over-simplified summary of his view of Human Computation fits in one sentence: let’s use humans to perform complicated tasks that computer cannot do. Re-Captcha is indeed an example of such a methodology, but his approach becomes far more evident with the EPS game: humans are tagging Google images by the thousands every day, without getting paid…

    - Social events and networking: I’m not exactly a social person, but I was dragged around and introduced to several people with very specific interests in MT. There are some cross University initiatives  that want to enable interfaces to our BV frontend.

    - The demo: I manned the demo booth for about 5 hours Friday morning.  It was uh… interesting… After a couple of hours switching among three languages I swear I have no idea what idiom I was trying to speak. 5 hours into the task and all that was left of my limited verbal communication skills were gone – I was babbling pretty bad. Anyway, aside from my failed attempts to communicate, here’s what happened:

    - The booth was always busy… Never packed, just a couple of visitors, but honestly I can’t remember any idle time between demos/discussions. Each visitor normally asked to see EVERYTHING we got.

    - Most of the crowd was very friendly towards me, but not so friendly towards MT and even less towards Microsoft. That said EVERYONE loved the Bilingual Viewer interface – and I mean EVERYONE! I got at least two people that hated MT - but used Google when needed :-) - to actually admit that “yeah, it’s more useful to see the original text than to get better translations sometimes” – and no, I did not have to get physical.

    - My “all the roads lead to Bilingual Viewer” mantra worked, and several people that do not use the IE toolbar said that they would try it just to get the button. IE 8 on the other hand didn’t get too much attention – other than from Microsoft employees, that is…

    - Firefox and the Google toolbar button got no attention – maybe they were just trying to be polite???

    - Finally,  the bot got a lot of kudos as well… The Text to Speech feature and the “portable translator scenario”  with Smartphones got people talking – a lot! I got at least two visitors running the demo to their friends, and adding the bot to their contact list right in front of me.

    "

     

    And here are some pictures...

    Academic Summit 2008_ 008 
    The Summit Entrance

    Academic Summit 2008_ 047 
    The Gamboa Resort - really nice!!!

    Academic Summit 2008_ 045 
    The Demo Booth

    Academic Summit 2008_ 040 
    The Miraflores Locks

    English - Portuguese

    Eu sou preguiçoso, e nao tenho vergonha de admitir… Assim sendo, eu vou copiar parte de meu relatório de viagem ao inves de escrever um blogue original (bom, vou retirar alguns topicos que eu acho que tem umas ideais interessantes).

    “Como alguns de vocês sabem, eu estava em Panama City na semana passada, participando do  Microsoft Research Academic Summit 2008 . O evento foi patrocinado e controlado pela divisão de conexões académicas para LATAM, e teve (de acordo com a equipe de funcionários da organização) o comparecimento de mais de 200 participantes.

    Segue um recap rápido dos eventos que eu atendi:

    - Breakout sessions:: muitas sessões que funcionam paralelamente. Eu gostaria de destacar duas:

    - “Porsimples: Simplificação de textos portugueses para a inclusão e a acessibilidade digitais”  - Thiago Pardo • Professor • Universidade de São Paulo (São Carlos)

    O professor Thiago apresentou um conceito realmente interessante para simplificar textos portugueses brasileiros.

    - “Computação humana” - Luis Von Ahn • Professor adjunto • Universidade do Carnegie Mellon

    O prof. Von Ahn é o autor do projeto Captcha e seu sucessor re-Captcha. Meu sumário hyper simplificado da sua ideia: vamos usar seres humanos para executar as tarefas complicadas que o computador não pode fazer. Re-Captcha é certamente um exemplo de tal metodologia, mas a ideia torna-se distante mais concreta com o jogo do EPS: seres humanos estão colocando nomes em imagens de Google aos milhares todo dia, sem nem ao menos serem pagos…

    - Eventos sociais e trabalhos em rede: Eu não sou exatamente uma pessoa social, mas eu fui arrastado e introduzido a varias pessoas com interesses muito específicos em MT. Há algumas iniciativas envolvendo varias universidades que podem habilitar interfaces para o nosso BV.

    - As demos: Eu trabalhei no demo booth por aproximadamente 5 horas de manhã de sexta-feira.  Foi uh… interessante… Depois que um par horas chaveando entre três línguas eu me juro não tinha nenhuma idéia que idioma eu estava tentando falar. Depois de 5 horas eu nao dizia mais coisa com coisa... Em todo o caso, segue um resumo do que aconteceu:

    - O booth estava sempre ocupado… Nunca lotado, apenas um ou dois visitantes, mas sinceramente eu não consigo lembrar nenhuma hora em que eu estivesse desocupado. Alem de tudo, a maior parte dos visitantes pediu para ver TODAS as ferramentas.

    - A maioria dos visitantes era muito amigável para mim, mas não tão amigável para a MT e menos ainda para Microsoft. Entretanto, TODOS gostaram do Bilingual Viewer - e eu quero dizer TODOS! Eu ate' consegui que dois visitantes que odeiam MT - mas usam Google quando necessário:-) - admitissem que  “yeah, as vezes é mais útil ver o texto original do que do que uma tradução um pouco melhor” - e Não., eu não tive que atacar ninguem.

    - Meu mantra “todas as estradas conduzem ao BV” funcionou, e muita gente que nem usa a barra de ferramentas do IE disseram que a tentariam apenas para usar o nosso botao. O IE 8 por outro lado não chamou muita atenção - à excepção dos empregados de Microsoft, claro…

    - Firefox e o botao do Google Toolbar não conseguiram nenhuma atenção - talvez apenas estava tentando ser polido???

    - Finalmente,  o bot conseguiu muita admiração também… TTS e “o tradutor portátil”  com o Smartphones fez muito sucesso - muito! Eu sei de pelo menos dois visitantes que assumiram as demos e mostraram o programa a seus amigos, e adicionaram o bot na sua lista de contatos na minha frente.

    "


    May 09

    Microsoft Research Academic Summit 2008 - Panama City

    I'll be demoing our Machine Translation features (including the bot) next week in Panama. The summit will run for 3 days - May 14 to 16 - and the our Research Area Manager (Alex Acero) will give a presentation on the 15th. I'll be manhandling the booth on the 16th.

    http://www.microsoft.com/latam/msrsummit08/ 

    If you happen to attend please stop by... There are a couple of new things I can show, and I'd love to hear back from your experiences using the bot.

    Cheers!

    English - Portuguese

    Eu estarei demonstrando nossas features da tradução automática (que incluem o bot) na próxima semana no Panamá. O congresso funcionará por 3 dias - maio 14 a 16 - e nosso gerente da área de pesquisa (Alex Acero) dará uma apresentação no dia 15. Eu estarei apresentando as demonstrações no dia 16.

    http://www.microsoft.com/latam/msrsummit08/ 

    Se você estiver por lá apareça… Tenho algumas coisas novas eu posso mostrar, e eu gostaria muito de ouvir sobre suas experiências usando o bot.

    Até lá!


    Two releases, one post/ Duas versoes, um post

    It's been a while since I had time to blog - a bunch of things have been happening lately and time is not exactly an abundant resource for me nowadays...

    Anyway, I got some news to share about our product (the real thing, not the bot!): we now offer links to an oline dictionary and a partner website that provides human translation. I'm sure some press release will soon come out with the official announcement, but given that we have been live for two days now I think it's no secret, right?

    The dictionary services are provided by Encarta, and can be very useful in the case the machine translation results look too weird for a given word. The link is offered for just a few languages for now:

    • English to Spanish
    • Spanish to English
    • English to French
    • French to English
    • English to German
    • German to English
    • English to Italian
    • Italian to English

    The human translations are provided by Live Translation and is only offered for the English market. I found the company name very cool, not to mention that it's a great match for our website. Again, I'm not aware of the details of the business partnership - all I know is that they are their own company with no other ties to Microsoft, but I think it's great to be able to offer such an option for users that need human quality translations fast. Their services are also restricted to the following languages for now:

    • English to Spanish
    • Spanish to English
    • English to German
    • German to English
    • English to Italian
    • Italian to English
    • English to French
    • French to English
    • English to Portuguese
    • Portuguese to English

    Here is the video of the demo - nothing really exciting but at least you guys can get a feel of how it works...

     

    Enjoy!

    Helvecio

    English - Portuguese

    Faz bastante tempo desde que eu tive  tempo de blogar - varias coisas tem acontecido ultimamente e tempo não é exatamente um recurso abundante para mim hoje em dia…

    Em todo o caso, eu tenho algumas boas novas sobre nosso produto (o autêntico, não o bot!): nós agora oferecemos links para um dicionário oline e para um Web site que forneçe tradução humana. Eu sou certo algum artigo  sairá em breve na imprensa com o anúncio oficial, mas dado que nós ja' estivamos ao vivo faz dois dias, eu acredito que não é nenhum segredo, certo?

    Os serviços do dicionário são proporcionados pela Encarta, e podem ser muito úteis no caso que os resultados da tradução automática sejam estranhos demais para uma palavra dada. O link é oferecido para apenas algumas línguas por agora:

    • De inglês para espanhol
    • Espanhol ao inglês
    • De inglês para francês
    • Francês ao inglês
    • Inglês ao alemão
    • Alemão-inglês
    • Inglês ao italiano
    • Italiano ao inglês

    As traduções humanas são fornecidas perto Live Translation  e são oferecidas somente para o mercado de lingua inglêsa. Eu achei o nome de companhia muito legal, para não mencionar que é perfeito para nosso Web site. Fora isso, eu não estou ciente dos detalhes da parceria do negócio - tudo que eu sei é que é sua própria companhia sem outros laços com a Microsoft, mas eu acho que é muito bom oferecer tal opção para os usuários que precisam traduções com qualidade humana rapidamente. Os serviços estão restringidos às seguintes línguas para agora:

    • De inglês para espanhol
    • Espanhol ao inglês
    • Inglês ao alemão
    • Alemão-inglês
    • Inglês ao italiano
    • Italiano ao inglês
    • De inglês para francês
    • Francês ao inglês
    • Inglês ao português
    • Português ao inglês

    Está aqui o vídeo do programa demonstrativo - nada de muito excitante mas pelo menos você podem ver como a coisa funciona…

    Aproveitem!

    Helvecio